Archive for Web

Thinking of changing hosting company

I purchased shared hosting service from Midphase years ago and that is where this site is hosted. It is up for renewal before 10/11.

Every year during this time, for the last 2 or 3 years, I toyed with the idea of switching to a different hosting company, because the inflexibility of not having root access. The current annual price from Midphase is around $136 with this breakdown: haidongji.com (MPan) $96 and DevPack – Unlimited MySQL & Subdomains $40. Here is some server specs:

# Percona Toolkit System Summary Report ######################
        Date | 2012-09-27 21:13:49 UTC (local TZ: MDT -0600)
    Hostname | some server name
      Uptime | 197 days, 12:31,  1 user,  load average: 5.87, 4.95, 4.89
    Platform | Linux
     Release | CloudLinux Server release 5.8
      Kernel | 2.6.18-374.18.1.el5.lve0.8.57
Architecture | CPU = 64-bit, OS = 64-bit
   Threading | NPTL 2.5
    Compiler | GNU CC version 4.1.2 20080704 (Red Hat 4.1.2-52).
     SELinux | Disabled
 Virtualized | No virtualization detected
# Processor ##################################################
  Processors | physical = 1, cores = 8, virtual = 1, hyperthreading = no
      Speeds | 1x2400.000
      Models | 1xAMD Opteron(tm) Processor 6136
      Caches | 1x512 KB
# Memory #####################################################
       Total | 15.5G
        Free | 500.9M
        Used | physical = 15.0G, swap allocated = 4.0G, swap used = 397.2M, virtual = 15.4G
     Buffers | 835.2M
      Caches | 5.3G
       Dirty | 254020 kB
     UsedRSS | 18.6G
  Swappiness | 0
 DirtyPolicy | 10, 80
 DirtyStatus | 0, 0

I looked at some Virtual Private System (VPS) providers. Linode’s smallest offering, Linode 512, provides 512MB of RAM and 20 gig of storage at a cost of $20 per month. NTC Hosting’s VPS Hosting vBox 1 provides 1 gig of RAM and 10 gig of storage at a cost of $20 per month. I’ve also browsed Rackspace, InMotion, and others. I don’t know, if I do decide to go with VPS, I will probably pick between Linode and NTC Hosting. Either way, it looks I need to pay $100 extra per year if I go that route. And I need to transfer domain name, which I’ve never done before. There is also the factor if my site is still accessible in China if I change hosting companies…

Anyway, if you have any recommendations on hosting service providers and comments, I am all ears.

Comments

开源软件的参与及社区互动的一些体会和建议:沟通和交流

开源上的项目有时需要和国外的人员沟通。怎样沟通,怎样建立互信,这是个非常大的题目。我把观察到的和蹦到脑子里的想法写出来。如果读者有问题,可以提出来。

我在美国待了很久了,也到过一些其他国家和地区。依我看,不管白红黄黑棕哪个国家哪个种族的人,不管你是女皇还是屌丝,本质上讲大家都是人,没大差别。大家都有七情六欲,都有那么点小可爱和小肮脏,都要屙屎放屁。和你我一样,女皇伊丽莎白的屁和屎照样臭,当然还不能排除更臭的可能。大家脱了衣服后都是那几样东西,毛或多或少,高矮大小尺寸有点不同,连披金戴银穿着红皮鞋的德裔种族主义者现任教皇也不例外,不管你外表如何的冠冕堂皇。有的还可能像奥巴马总统一样有点口臭,特别是清晨刚睡醒后那段时间(这是根据第一夫人未当选前的表述,后来她不说这个了。期待方舟子科普口臭的原因和防治)。当然这不是教你去不修边幅,形象还是很重要的,因为形象在一定程度上反映一个人有无自尊。每个国家每个地区每个宗教和无宗教的人都有人的闪光和可憎之处,部分因为经济、习惯和教育的原因,大家的表现(不少人喜欢称之为“素质”的那个东西)会有不同,这都没啥。

乱七八糟地说这些,意思就是说国外的人和你我一样,都是人。抱着以人为本的信念来互相尊重和学习,体谅和理解,知道自己的尊严、自信和底线来结交朋友。有了这个出发点和任何人沟通和交流,给你打包票,错不了。

下面来谈谈一些小建议。我以为这些建议,相关部分在本国同事之间的交流上同样管用。当提到国际友人时,我指的是所有国际友人,不管国籍、肤色、宗教信仰、性取向等。不管你是美国白人、黑人、外籍华裔,不管你来自非洲、中东、日韩、南美,一视同仁地以尊重、友好的方式来维护双方的利益。如果你不希望别人以刻板的方式来对待你,那你就不要以刻板的方式来对待别人。己所不欲,勿施于人,你要有这个风范!

1. 目前国际上交流的载体大部分是英文,所以不少人在这方面会有障碍。但不要因为有了这个障碍就不敢交流,不要因为害怕病句、拼写的错误而放弃交流。你当然要努力尽量用正确的词和句法,但如果词和语法不完美和正确但意思到了,那么这个交流就很有意义。这样一来二去,你的外语水平会提高。在本文的最后我有提高英语的小建议。另外,其他参与到开源软件的人可能来自非英语国家,他们的英语不见得比你强到哪里去;

2. 要注意名字的拼写。一般来讲,别人怎样自称,你就要用那种拼写方式,包括字母的大小写。我看到一些从国内来的电邮,其中有的不知何故的改变别人名字的大小写,请不要这样做;

3. 无论是书面还是口头交流,千万不要不懂装懂!如果你没搞明白,如果这个事情不是鸡毛蒜皮之类的小事,特别是牵扯到计划、行动、和时间安排等对他人有直接和间接影响的信息,不要敷衍了事!你没搞明白,你可以说,对不起,你可以换一种方式来解释吗?或者你可以以你的理解方式复述重要的交流信息,以此来确认和验证彼此观点和计划的一致性。千万不要在双方还没真正达成一致的情况下拍胸脯、打包票,结果损人损己;

4. 口语交流上,不要太在乎口音。能表述清楚是第一要务,所以说的时候不要着急。一般来讲说慢些会有利于理解;

5. 哈哈一笑是比较常见的沟通方式,也是化解矛盾、将就着过去的方法。另外,我们中的不少人和国际友人交流的机会不多,有好奇心甚至觉得国际友人的举止比较可爱的情况很正常。再加上语言的不便,这种有点紧张的笑声就更容易听到。但我感觉在大多数情况下,国际友人,特别是不太了解东方文化的,可能会以为这种笑对他们来讲有点奇怪甚至难以理解。这不是说面对面沟通或打电话交流时不能笑,大家都板着脸。重要的是能察言观色,观看肢体语言和表情,这方面我感觉东西方的差别不大,并根据这些观察来调整和理清模糊的观点。有些东西,一次解释不清不要紧,以后时机成熟时再提也不迟;

6. 对外交流增多,有很多人来中国,我们要逐渐适应、学习、尊重、和欣赏他们所带来的多样性和多元化。举个小例子,面对面交流时,我们尊重别人的饮食习惯,有人吃素,有人不习惯吃整的带刺儿的鱼等等。尊重别人的时间和空间,有计划并及时沟通;

7. 既然我们都是人,那么国际人士和国内同胞一样,也不乏混蛋、瘪三、种族主义者、圣人蛋、猥琐的小人混蛋之流。再加上事情的偶然性、沟通障碍、不合宜的时机等,有的项目即使我们做得很好,也可能因为各种各样的因素,我们的patch,feature set等不被接纳。在这种情况下,在合作的努力没有结果后,我们可以发布自己的分支和大家共享和进步。

拉拉杂杂,就先写这儿吧。另外,最近在微博上总结了些学英语的小建议,也在这儿先放着吧,如下。

不论哪个语言,想把东西表达清楚和准确,都要认真努力花时间下功夫,母语也是如此,何况外文。多读多写,慢慢积累。读的话,读好的原版的关于自己本身就感兴趣的主题的作品,这样读时就不会觉得枯燥,读得下去的同时可以提高词汇量,学到好的句法和表达方式。举个例子,如你喜欢伍迪艾伦的电影或乔治卡林的单口相声,就可以先在亚马逊上找关于他们的书,要读者评论口碑高的那些,然后弄来读。注意到的新词和好的表达方式,要试着用。个人体会,一些新的词和句法,如果能在合适的场合自己用过一次,就算掌握了大半。多用几次,就是自己的啦。

一开始读外文书时可以囫囵吞枣,但有的词老出现老不懂就要用字典啦。要有好的英汉字典。个人以为如果到了可以用纯英文字典来学新词并且到完全可以理解的地步,那英文水平就很不错啦。

我认为过了六级英语的同学没必要通过读报纸和杂志英语新闻来提高,因那都是肤浅空泛的八股句式,搞得人很浮躁和浮漂,蜻蜓点水一样,内功提不上去,个别的长的深度报导除外。我不是开玩笑,我觉得读《洋葱》(The Onion)学英语要比读NYT,The Wall Street Journal,Time Magazine,Newsweek等更有效和有趣。National Geographic还行,但质量也在下滑。最好是读书,安静一下,每周找个时间,沉下心来,给自己放个假,读本好书,陶冶性情,平稳而满足。在《洋葱》那里你可以逐渐理解部分美式的幽默和讽刺!祝学得愉快!

Comments (4)

开源软件的参与及社区互动的一些体会和建议:学习和参与

有了沙盘弄熟了工具,下面我们来谈谈参与一个项目的开发和测试。我们先从项目的参与者角度开讲,之后再谈项目的发起者应注意的事项。如前所说,这些是我的一些体会和建议,很多方面都是“仁者见仁、智者见智”,所以欢迎大家拍砖、提建议和指教。

要参加一个项目,首先要开始学习,一举成名、一口气吃成个胖子的可能性不大。学习包括阅读文档,该项目的维基网页,加入mailing list,阅读项目发展蓝图,加入论坛(forum)潜水等。在做这些的同时,搞一个自己的branch,编译软件,练手调试,改变一些东西后再编译以满足自己的好奇心,这些都是非常有效的学习手段。

通过在mailing list和论坛上潜水,你可以了解到主要人员的活动、重要的源代码、发展方向、和他们的个性等。如果交流是以英文为主,还可以学习到常用的名词,为以后的研究、搜索、和提问带来方便,因为你会注意到,网上查资料搜索的关键是知道关键词!当然有些比较流行的软件还会有其他独立的社区,如Google group等,那里也可能有些有用的东西。

邮件表的历史很多都有归档,所以那里也可能有有价值的东西。另外,不少开源软件还有互联网聊天频道,IRC,一般是在freenode上。像MariaDB在freenode上的maria频道就比较活跃。这个真是因项目不同而异。一般来讲,我个人并不建议在聊天频道上呆太久,因为很浪费时间并且会分心,很难集中精力花时间做好一件事。但IRC频道的聊天有时也会有记录,所以周期性的快速浏览下可能发现点东西。如果你是有备而来,如果主力人物都在聊天频道上的话,有针对性的在IRC上讨论些问题可能会比较快和直接地找到答案。

在潜水的同时,也要注意性能和bug的标签。如在Launchpad上,有的项目给一些性能和故障贴上low hanging fruit,即易采摘果实的标签。你可以先从这里开始,看看自己能不能搞定。不妨先在自己的沙盘里大胆尝试下,写单元测试实验案例,改下代码,编译测试,推测和验证各种假设。反正是自己的沙盘,尝试下又有何妨?只有敢于尝试,满足自己的好奇心,才能提高自己的功力。

同时,参与并帮助一个项目的测试和文档也是融入该项目的好方法。开源项目是分布式开发,程序员分布在不同的地方,实际上不少非开源项目也是如此。人不在一个地方甚至国家,很可能有语言障碍,就需要花时间了解沟通和建立互信。如果你可以先在测试、文档等基本方面帮忙,就可以建立起良性的互动。这也是我建议先读文档、入邮件表、到论坛潜水学习的原因之一。比方说你可以帮助完善该项目的维基网页,提交一些自己亲身做过的how to文档,提交测试案例等。因为大家一开始对你不了解,如果你一上来不先做调查研究,做好功课,就开始指点江山、激扬文字,要显示自己的聪明才智和独到之处,那么,抱歉,没多少人会买你的帐。

在开发和使用的过程中,你可能会遇到故障。发生了这种情况,在提交故障报告(bug report)之前,请首先在故障表、邮件表、论坛里搜素下,看看别人是否已经提交。如果没有,那你应当提交一个故障报告。提交时,请注意说明系统环境和配置,有没有绕开该故障的办法,怎样才能重生该故障。如果你知道怎么来解决这个故障,那当然更好,那就请提交你自己的补丁。有的项目需要提交测试案例(test cases),有的不需要,但作为一个程序员,你要有自己的test case。我以后会专门写到测试。

——

下面简单说说我关于项目发起的想法和建议。

首先,心里要有这个数:我这个项目是给自己kuai痒的(英文俚语scratch an itch,正式用语可能是抓痒吧,至少鲁南话说三声的kuai,不知有没有这个字)。这个项目满足了我的需求,对我本人有用,这是最重要的。能切实解决我的问题,那别人遇到类似情况,我的解决方案也就可能管用!我开发的过程中会有乐趣,会有挑战和能学到新东西,但知道它能帮助别人也是很大的乐趣。我希望它能火,并且也下力气让它火,但是它火不了的话也没关系。这不是阿Q的精神胜利法,这是全球各地绝大多数开源软件所面对的现实!

那么,我做开源,有意义吗?当然有。简要地说,自己做开源基本上是业余,而不是全职的做商业软件,所以风险小。但如果火起来的话,会有商业利益过来。另外,开源的目的是知识的积累和分享,发起者在这个过程中可以得到全方位的成长:文档、测试、开发、协调、发布等,还可以认识到朋友和同仁来打通人脉。或许这个项目只能给不到一百甚至不到十个人带来益处,但只要它能给自己带来益处,就已经足够。

好,不谈哲学和自己做开源的其他好处,下面我们来谈谈想法和建议。

1. 要有好文档。好文档要告诉读者这个项目的目的,使用方法和流程,注意事项和如何扩展等。最好能做成维基式文档,这样的话可以便于别人的参与。这个文档要有典型的应用案例,给出自始至终的过程指导;
2. 要有良好的测试方法和机制,并把它写入文档。有效和系统的测试是生产可靠、稳定、高性能、高扩展软件的必要条件!
3. 如果有了规模,注意建立起自己的mail list,forum,group等,这样便于知识的积累,便于提问和解疑;
4. 要有计划性,这表现在有好的设计、蓝图和具体的任务清单(software specification,blueprint和To-do list)等,这样便于和别人讨论和鼓励参与;
5. 应当还有别的。先写到这儿,欢迎指正 :)

Comments

开源软件的参与及社区互动的一些体会和建议:熟悉源代码的管理方式和工具

接上篇。上次讲到建立自己的沙盘。这是一个开源软件开发的小系列,简单介绍下一些经验和体会。

凡是有点规模的开发,都需要有源代码管理。实际上,即使是自己编个程序、写个脚本或文档,源代码管理也可以提供很多的便利。

源代码管理经历了几代的沿革和发展。从最初的单文件加锁和没有网络支持,发展到具有网络支持的集中式控制代码管理,现在这种方式还是占据不少的市场份额。在共同开发方面,集中统一式的管理要求你必须先合并(merge)后才能提交(commit)。代表性的统一式代码管理工具和产品有CVS,Subversion,TFS等。在统一式代码管理系统下,我们只有一个总代码库(repository)。

最近几年开始流行分布式源代码管理系统。跟传统的统一代码管理不同的一点是分散式代码库:即每一个开发员有会自己的代码库实例。代码被改动过之后,开发人员可以先提交到自己的实例上,然后合并。代表性的产品和工具有Bazaar,Git,和Mercurial。

我用过CVS,Subversion,Bazaar,和Git。我个人的经验是它们各有利弊,当然我没有build engineer的经历,所以我在这方面的经验并不丰富。Linus Torvalds几年前在股沟有一个关于Git的讲演。他讲得不错,有时间的话值得一看/听。当然用哪一个系统(中央vs分布)在很大程度上取决于开发团队的技术强项、熟悉程度、公司的目标和制度。不过现在从长远来看,分布式的源代码管理是大趋势。

插点花絮。Linus Torvalds(Linux的主创)和Monty Widenius(MySQL的主创)都是以瑞典语为母语的芬兰人。Linus讲基本上听不出外国口音的美式英语,个性比较高傲。Monty的英语口音比较重,但表达没问题。口音不可怕,能听懂,可以把意思说出来就好。

从开源的角度来看,用什么代码库和工具在很大程度上取决于这个项目放在什么平台上。如果你感兴趣的项目在Launchpad上,那你当然要花时间学好bzr,如果是在Github上,就要练习好git。当然如果你是一个项目的发起者,你就可以自己决定用哪个平台。现在比较流行的平台有Googlecode,Launchpad,Github,SourceForge等。Launchpad只用Bazaar;Github当然只有git;Googlecode支持Subversion,git和Mercurial(应当是三者选一);SourceForge好像只支持CVS和Subversion。

不管哪个平台,特别是分布式代码系统的东西,很多情况下你需要通过ssh来和托管机器(hosting URL或机器)交流,这就需要你自己的ssh key。如果你还没有,可以通过Linux系统上的ssh-keygen来生成这个外向和私有的key。生成了自己的id_rsa和id_rsa.pub的key文件之后,要把它们保管好,因为那个id_rsa.pub的key会被提交到Github,Launchpad等地。而id_rsa.pub是外向的,我们可以用它来和私有的id_rsa来验明你的身份。

选中了源代码管理工具和托管的机器或平台,你可以自己建几个Utility的项目来练习一下,如果你对源代码工具不熟的话。像在Googlecode,Github,和Launchpad等地很容易就可以建立起自己的开源项目,你可以放进去自己常用的脚本和自己写得小工具等。这即可以保存自己的脑力劳动成果,也可以练习源代码工具的使用。实际上在开源领域里做,bzr/Launchpad,git/Github/Googlecode等都要熟悉。常用的命令如clone,commit,pull,push,status,log,revert,blame等要明白和会用。

当然你也要知道怎样用diff来做个补丁(patch),和怎样来贴别人提交的补丁。这包括只补一个文件,多个文件,和多个分散在不同文件夹里的文件。关于运用diff和patch,这些东西只要可以接触到Linux的机器就可以练练。

说起diff,有很多的GUI工具比较好用。在Windows上你可以用开源免费的WinMerge。在Linux上我有时会用kdiff3,比较喜欢。我以前在公司里用Mac的时候,听说苹果的FileMerge比较好用,但我没试过。如果你用git和Linux,那么gitk这个GUI工具非常好,观看历史,分支,标签等都一目了然。我上次和MariaDB的wlad在一起,他告诉过我一个不错的bzr的GUI工具,好像是在Linux上,但我忘掉是哪一个了。

之所以讲diff,是因为我感觉在任何提交(commit)之前,你要再读一下diff。我以为这是一个最佳实践。阅读其他程序猿的diff也是一个好主意,这样你会对同事和合作伙伴有更多的了解。这也是一个非正式的code review,你也可能学到不少东西。

其他最佳实践还有要舍得用标签(tags)。标签不占地方,特别是在分布式代码管理上,但它却可以提供一个简洁明了的记号,便于管理和分类。另外,在提交时要写好的、言简意赅的短评。不要只说“bug 123 fix”,简要告诉我bug 123是怎么回事和如何改正。当然能做到言简意赅最好,如果做不到,没关系,以后慢慢提高,但请宁多勿缺,如果自己写不短的话,长一点没关系。

当然,在提交之前至少要过自己的unit test,并提交test cases。还要过其他的测试。测试太重要,以后会专门来写一篇。

Comments

开源软件的参与及社区互动的一些体会和建议:建立自己的沙盘

接开门篇,这是个小系列。

古人说得好,吃一堑,长一智。又云:失败是成功之母。记得有位外国著名科学家曾经说过这样一句话:“砖家是在一个狭窄的领域里犯过所有痛苦错误的人”。总而言之,古今中外的经验告诉我们,人是在错误中成长起来,所以不要怕犯错。怕得是犯了错但不承认或不愿意从中学习。为了鼓励学习、尝试和应用一些新东西,把错误的成本最小化,我们可以做沙盘演练。而IT的沙盘,在很多情况下是虚拟机。(哈哈,哥想写范文。各位童鞋猜猜看,那句旁征博引用来讨老湿欢心的科学家名言,是我的编造还是真有类似的句子?)

下面是我个人的一些经验、体会和建议:

1. 建立自己的虚拟机,有Debian,Centos,Windows等。有了自己的虚拟机,可以以快照(snapshot)的方式保存基本的虚拟机器。在此基础之上,练习一些软件的编译和制作(compile and build),发现各个部分之间的依赖性(dependencies),下载源代码并进行阅读和调试,安装一些软件和工具来尝试和学习等。如果做错了,可以打倒重建,没什么大不了的。所以要敢于尝试!

我现在有一台联想的ThinkPad笔记本,用了Linux Mint 12 KDE的distro,然后自己下载并安装了VirtualBox。在此基础之上,我用Vagrant和veewee来构建和管理虚拟机,感觉非常给力。Vagrant和veewee的一个优势是可以用来比较容易地建立多机环境,web server,database server,proxy server等。我这有个介绍

2. 用云计算服务来搭建自己的沙盘,虽然我现在用得少了些。
我在云计算厂商(Amazon和Rackspace)有自己的账户。我对国内的云计算厂商的运营方式不了解,但我一月初在北京时听说国内也有类似服务。我经常在Amazon和Rackspace上启动几个机器来做实验,因为花不了几个钱。像在Rackspace上起一个256MB的Linux虚机,一小时也就一美分左右。所以如果国内有这样的服务,自己开个户玩玩挺有意思的。

3. 购买自己的主机服务,一为练手,二为翻墙。

能翻墙是必须的,因为长城很弱智,阻挡了太多的科技信息和交流。每个国家都有网络监管并且也需要网络监管,每个国家都要采取措施来保证信息和网络安全,每个国家都想支持本国的IT发展并且也会出台政策和举措来保护本国产业,这些都无可厚非,没啥偷偷摸摸,不好意思的。但长城,和中国的不少做法一样,搞一刀切,那么僵硬、笨重和愚蠢,里外都不讨好,该想办法改进和提高了!

翻墙的一个很流行的办法是VPN,而不少VPN是要付费的。这就不如在国外买个主机服务,因为国外的主机服务可以起到一石二鸟的作用:有了自己折腾的机器,同时还可以用来翻墙。主机服务不会比VPN贵到哪里去。有了它之后,你可以用国外主机来暗渡陈仓,搞个ssh tunnel上网,长城拿你没办法。但这要求主机服务允许你这样折腾,所以要注意用哪个厂家的。感觉Linode比较靠谱,因为看上去给你root,并且可以打倒重建。在这方面,冯大辉的这篇博客有不少好建议。搞个具备境外支付的信用卡也是个好主意。我几年前写过怎样用ssh在Windows上挖个地道来传输http的交通,那时公司内网管得紧。不知道现在还管用吧,但至少可以提供些关键词供你查询。

有了自己的沙盘,就可以无后顾之忧地在上面耍耍,满足自己的好奇心,多尝试和总结经验教训,我想就会慢慢提高自己的内功。

Comments

Recommendation: Vagrant and Veewee

Note: I’ve decided not to use Veewee due to silly compatibility issues for now.

Quoting from Vagrant’s web site:

Vagrant is a tool for building and distributing virtualized development environments. By providing automated creation and provisioning of virtual machines using Oracle’s VirtualBox, Vagrant provides the tools to create and configure lightweight, reproducible, and portable virtual environments.

A complementary technology called Veewee makes building VirtualBox VMs easier by automating away a lot of manual steps. Marius Ducea has a great blog post on how to use it.

My observations:
1. According to Vagrant’s web site, it should work on Windows. I’ve tried that with unsatisficatory results. I think it works better on Linux and Mac;
2. Vagrant 0.9 was released recently, and is the version that I am using. However, 0.9 broke some backward compatibility such that a lot of examples on Vagrant configuration file in its web site no longer work. But it does provide good enough error message for you to fix and adjust;
3. Just a couple of weeks ago, Veewee was not compatible with Vagrant 0.9, but that has since been fixed. I mention this because things appear to be a bit fluid, and you may need to roll up your sleeves and tweak a few things yourself to get what you want;
4. Using Veewee to build Windows VM is not as smooth as doing the same for Linux VMs. In fact a few of the templates do not have the Cygwin setup file that definition.rb refers to. Another drawback is that the initial VM harddisk size is too small (10 gig I believe). Darn it, I forgot where I changed the setting to make it bigger before building it. Share that with me if you know please :)
5. In addition, it seems hard to build a Multi-VM environment with Windows in the mix. It looks possible, though. Once again please share that with me if you know!

Potential use cases:
1. Hacking, learning, and development. It provides a safe environment to play around, build and compile things, learn new technologies, etc. For example, I’ve used it to test and play with Tengine and Nginx. I’ve also built a Multi-VM environment where I tested MariaDB 5.3 and the new Percona Tools, pt-table-checksum and pt-table-sync in particular. I think Vagrant is a great tool to learn Chef, Puppet, and Hadoop;
2. Testing: testing software on different distros, continuous integration testing for server software (web server such as Tengine, database server such as MariaDB and Percona Server). In fact, using a Centos 6.2 VM, I found Percona’s 5.5 RPM packages still haven’t resolved header file conflicts, an old problem.

Sample Multi-VM Vagrant file
It is really convinient to have a Multi-VM environment for development and testing. Vagrant can do that but there is a shortage of good samples, especially for Vagrant 0.9. Here is a sample that worked for me. Note that:
1. The VMs in the environment can be made from the same image. In the sample below, “debian” and “xiaosaier”‘s daddy is “debian6″. No joke intended;
2. Use “vagrant ssh debian”, “vagrant ssh centos”, and “vagrant ssh xiaosaier” to get to each VM. Each VM can talk to one another via the IP address defined. Therefore it can be used for good, realistic testing. After having good Chef recipe or Puppet files, the VMs can be made in a certain way, which can be used for Continuous Integration Testing.
3. The hostonly network IP address works very well. However, the VM takes the name of the image it is based on by default. It will be nice to be able to customize the VMs’ names. Let me know if you know how;

Vagrant::Config.run do |config|

config.vm.define :debian do |debian_config|
debian_config.vm.box = "debian6"
debian_config.vm.network :hostonly, "33.33.33.10"
end

config.vm.define :centos do |centos_config|
centos_config.vm.box = "centos62"
centos_config.vm.network :hostonly, "33.33.33.11"
end

config.vm.define :x iaosaier do |xiaosaier_config|
xiaosaier_config.vm.box = "debian6"
xiaosaier_config.vm.network :hostonly, "33.33.33.12"
end

PS. Note, the combination of colon and letter x turns into an emotion icon above, at least viewed via the web page. Watch out!

Comments

Velocity 2011中国行随记

这次到北京参加Velocity中国大会,感觉很不错。记录下自己的感想和体会。

参加任何会议,对我来说最有意义的是和参会者的互动与交流:业界的新发展,某些技术的实战经验,网上和网下的资源,好书好网站的推荐等。很多灵感都是在谈话中通过思维火花的碰撞而产生。还有一部分干货是谈话者有意无意中透露出来。这就需要听者有开放的视野和耳朵,懂得聆听,不打断别人的话语(特别是在关键时刻),记下这些小金块:有用的工具啦,一些参数的设定啦,实战中碰到的问题和解决办案啦,提高工效的技巧啦,很有用的网站和论坛的帖子啦,等等。记下这些东西后,注意不要把它们遗忘,要跟踪和研究。因为趁热打铁,凭着这股子热乎劲儿才能把那转变成对自己和公司有用的东西,才能跳到更高的层次。有时参加大会后能收到一个这样的小金块就够本甚至有盈余。所以作为管理人员,在给下属买书和参加会议上,不要吝啬猴精。说到这里,如果你是个管理人员,你有没有拨出资金给员工买书?如果有,恭喜你,因为我感觉这是一个非常值得自豪的东西!那就再进一步,你有没有在搞好财务的同时让报销的流程更容易?你有没有在保证工效的同时给下属提供工作和生活上的方便?

在这同时,也要去回馈。懂得回馈,懂得提携和帮助同仁和后来人,才能获得人脉资源,并且自己也可以在其中得到灵感和启发。因为解释和分享一些东西的时候,也是自己学习的时候。当你把东西用口头语言表述出来给同仁的时候,这本身就是一个非常有效的思索过程。你能把事儿说圆吗?如果不能,为什么?是不是自己理解得还不够透彻?在这过程中,别人甚至你自己会突然意识到为什么没从这样或那样的层面和角度来研究和尝试这个东西呢?同仁和后进的提问也能产生很好的启发。另外,这也是我坚信的一点,让自己利益最大化的最好办法是不自私,不信你在生活和工作中试试看。自以为高明,自以为是牛人,自以为别人和大多数人比你低下,玩儿清高装逼的那一套,这种态度,只会带来坏处,不会有丝毫的好处。关于回馈和帮助提携他人,我写过一个纪念我的同仁Ken Henderson的文章,引用了他的一个aging champion syndrome(我觉得可以翻译成过气冠军症)的短文。他讲得非常透彻和精辟!英语爱好者不妨注意下,Ken写的东西很值得学习。

以上都是个人层面上的东西。提高到公司和企业的角度,也是同样的道理。现代的互联网公司需要一个开放和互动的平台。而作为公司来参与这个平台的构建并保持和发展其活力对公司本身大有益处:公司本身的人气、内部员工的士气、和在业界的口碑,并且在这个平台里也会有高质量的人力资源。

从互动、交流、开放、分享的角度来看这次Velocity会议,我感觉组织者做得非常成功。淘宝和淘宝的员工们和O’Reilly投入资金、时间、和人力资源来办Velocity是一个非常有意义且值得称道的事情。这种开放和互动的平台需要各种大小公司的参与,进而形成一个良性循环,这样我们就可以把事情做大、做活。水涨船高,众人拾柴火焰高,不就是这个道理吗?现在淘宝是这个活动领头人,但希望百度、腾讯、网易、新浪、华为、谷歌中国、雅虎中国、和微软中国等其它公司一起加入到这个行列来。

我在会上做了个基本的关于InnoDB状态的分享,并且也参加了几个演讲。英文主题演讲时,有中文的同声翻译。我看到有估计不到1/3的人用同声翻译的耳机。很遗憾,我没来得及试听一下。我倒是找到机会试听了下中译英的同声翻译,感觉效果并不太好。我很想听听大家对英译中的评价。

Steve Souders讲的一些工具和方法比较有意思。章文嵩的绿色计算也是亮点。我听了淘宝叔度和清无的基于nginx的Tengine的介绍。这个与我是个亮点,因为我感觉互联网服务器是一个不管大小公司都要有的东西,而Apache和lighthttpd好像都有点过气,其笨重和抗压的表现都不尽人意。而nginx和在其基础上提高的Tengine确实让我眼前一亮。我加入了Tengine的邮件列表,感到其人气,特别是在中文圈里,在慢慢上升,这是一个可喜的现象,我对其非常看好。

顺便加一句,淘宝的开源软件可以在这里找到。很多东西看起来都比较有意思,像这个tsar。淘宝的博客也很棒,我订阅了淘宝核心系统团队博客淘宝共享数据平台博客。另外很多淘宝员工的个人博客也很棒,特别是如果你也搞MySQL的话。像苏普的这个Perl脚本就很管用,而江枫的Flashcache介绍和讨论也会很有启发。stronghearted的博客褚霸的博客也非常好。

星期二晚上有机会和叔度、冯景辉长谈,海阔天空,保罗万象,聊得很开心。靠,叔度和景辉很牛逼幽默。从叔度那里,我不得不由衷地得出如下结论:山东人不简单啊,好得很!凌晨左右,多谢景辉,我们到创新工厂参观。我喜欢和欣赏李开复干出来的事和其影响力,能到创新工厂看看很不错。

另外豆瓣刘洪清的MapReduce分享也很有料。在会场外也和出版界及网上IT社区的一些编辑做了交流,很有意思。和苏普和江枫有了更深的关于MySQL的交流。

感谢苏普、淘穆公、江枫、和吴炳锡的邀请和盛情款待。星期天晚上刚坐了14个小时的飞机和堵了两个多小时的出租,疲惫不堪,没胃口享受云南真菌火锅的美味。但和Virident的Leon一起吃了非常美味的东北菜。谢谢Leon!和jackbillow还有hellodba的交流,听他们的环境和应用也很有意思。还认识了很多其他人,就不多说了,名字可是记不太清,因为大家有微薄的帐号,淘宝的还有武侠花名。

——

Velocity里谈到的东西大都和开源软件有关。我以前和国内的刘忠武一起做过关于数据库测试的开源软件,AnyDbTest。这个软件绝大部分是忠武老弟用C#写成。忠武是个很强悍的程序猿,C#,Java,Oracle,SQL Server,Python,Linux Shell脚本等都拿得起,放得下,想法周到、细致、全面,生猛异常!

——

我12月4日星期天下午到,北京城正被大雾和空气污染所覆盖。到大会期间,天气已经好转,一片晴朗。星期三那天,从旅馆11楼往下看,看到附近学校里有体育课在进行。当时看到年轻的学生们能在日光和蓝天下在学校的操场上跑步,感觉真好,那前两天的坏天气和疲乏所带来的阴郁感也一扫而光。周一中午一个人吃了海底捞,很不错。海底捞的服务态度那么好,希望也能给其他商家店面的客服方面带来正面连锁效应。周三晚上会议结束后有很短的时间,我顺着远大路往西走,到四环后右转往北走了走,看到遛狗的,摆地摊的,然后到路边的一个小馆要了个蒜苔炒肉盖饭和一小碟芹菜花生米,很不错。这么吃着,走着,看行人和小饭馆的顾客,读着我同胞的表情、动作和喜怒哀乐,聆听他/她们的标准和不太标准的普通话,猜测和想像他/她们的生活状况,很好。

吃北京咸菜也是亮点,那腌制的藕片和花生米,嚼起来脆生生的,特过瘾。我在王府井那个天主教堂的前面小广场上看到在晚上,人们在一起跳国标和恰恰恰,也很不错。星期天早上我逛到了东四清真寺,但那个地方谢绝参观,有点遗憾。在那天飞回美国之前,买了几本书回来看。

第一次坐高铁,感觉很不错,最高时速差不多310公路左右。以前北京到枣庄十来个小时的车程,现在两小时稍微多一点就搞定。虽然铁路还有问题,但总起来讲很牛啊!

Comments (2)

Getting rid of “Welcome to Internet Explorer 8″ screen

The lack of Vimperator function in Chrome, which exists in Firefox, prevents me from totally switching to it. Because I work in different environments in terms of different clients and operating systems, I have to use Internet Explorer sometimes.

And I found the “Welcome to Internet Explorer 8″ screen upon IE starting, if you have not followed Microsoft command to configure IE the first time you started, terribly irratitating. It has message like this in the window: “Internet Explorer 8 helps you use the Internet even faster than before. New features like search suggestions retrieve blah blah…”. Would you please respect the end user’s intelligence, get out of the way and leave him/her alone in peace, quite, and solitude? Sure, one can follow the wizard and set things up, but it feels like being violated. The ability to customize things is good, but not under your dictation.

Behold, there is a way! Come and follow my way, dear reader, for it leads to enlightenment and eternal happiness:

1. Start -> Run
2. gpedit.msc
3. Navigate to User Configuration -> Administrative Template -> Windows Components -> Internet Explorer -> Prevent performance of First Run Customize settings
4. Double click, then set it as Disabled.

Comments (2)

AWS Management Console is nice

If you want to play with Amazon cloud computing stuff, I think using AWS Management Console web interface is the best, easiest, and most intuitive approach, based on my experience so far.

My usage with Amazon Web Services has been only with EC2 up to this point. Prior to AWS Management Console, I had to set up Java, EC2 API tools, various path and environmental variables, certificates, keys, etc., etc.. It is a fairly convoluted process.

AWS Management Console is much easier, except for downloading PuTTY and PuTTYgen on Windows and tsclient on Linux, and a private key pair, everything else is handled inside the browser. Here are a few things I learned:

  • Once you are in, create a Key Pair. The web interface will prompt you to save it. Do so, because you will need it to start instances and, depending on what type of instances you start (Windows or Linux), you will need it for shell access (Linux) or for getting Windows administrator password for remote desktop access;
  • If you are working with Windows machine running Linux EC2 instances, get PuTTY and PuTTYgen. Follow instructions here to generate key that can be used by PuTTY. It worked for me. I got my private key pair file on Linux first, and then moved to Windows. It even worked with the ^M characters inside the file.
  • For security groups, I found the ones proposed by Amazon works fine. For instance, for a typical LAMP server, it proposes a webserver group where it opens up SSH port 22, MySQL port 3306, and HTTP port 80, which is normally what you want.

Good luck!

Comments (2)

WordPress 2.8, a step back

Update below
Reports in blogsphere about some WordPress blogs being hacked got me alarmed. So I decided to upgrade mine from whatever version it was at (2.3, perhaps, whatever the current version was a year ago) to 2.8, the latest, but certainly not the greatest.

The upgrade process wasn’t hard, just a bit tedious. After posting a new entry and it not showing up in Google Reader two days after the fact, I felt something was not right.

So I clicked the feed link directly, http://www.haidongji.com/feed, and got the error below:

Warning: include_once(/home/xxx/public_html/wp-includes/pomo/mo.php) [function.include-once]: failed to open stream: No such file or directory in /home/xxx/public_html/wp-settings.php on line 307

Warning: include_once() [function.include]: Failed opening ‘/home/xxx/public_html/wp-includes/pomo/mo.php’ for inclusion (include_path=’.:/usr/lib/php:/usr/local/lib/php’) in /home/xxx/public_html/wp-settings.php on line 307

Fatal error: Class ‘Translations’ not found in /home/xxx/public_html/wp-includes/l10n.php on line 407

The strange thing is that I did have mo.php in the right place, under wp-include. So I went to Feedburner’s site, now part of Google, and it didn’t have anything useful there. My sixth sense told me there might be something fishy with the whole Google feed integration business, so I decided to restore the .htaccess file to the state prior to Feedburner integration, and see what happens. Lo, it worked! That was last night.

Today I saw the comment page link was broken. After clicking the recent comments link on the right side, there was a 404 page not found error. Once again, I invoked my psychic debugging skills and decided to revert .htaccess to the one generated by Feedburner a few years back, the one I ditched the previous night. Behold, it worked!

Now some additional gripe regarding WordPress 2.8: why do we need to make the dashboard admin page more complicated than necessary? The 2.8 dashboard looks busy and noisy, and it made it considerably harder to go to places I wanted to go. After finally locating the settings page I am after, I need to scroll all the way to the bottom to view it! Keep it simple, please.

Update: It turned out I claimed success too early. After I reverted to .htaccess from Feedburner, I noticed the feed was not refreshed with the latest entry. So I went back to the original .htaccess file, where comment page was broken. I googled around and realized the permalinks was the culprit. So I did chmod 666 .htaccess, went to my WordPress admin page, saved permalinks changes, then chmod 644 .htaccess, and now I am back in business.

Comments

« Previous entries

Page optimized by WP Minify WordPress Plugin