• 2009-01-10

    回家 - [billjeff:Life]

    咱是到2020年买火车票就不会难了,09年到20年,还差12年,所以,想买到票,还得早起排队。昨天早上去外面吃早餐,顺便就去卖票点看了看,大概是9点火车站发票半个小时后之后才轮到我,Z9告知无望,D309只剩软卧。反正我也就是探探情况,看看排队的人多不多,自己更倾向于19号走。今天7点就起来了,虽然很不情愿:) 到买票点一看,还好,我排第四。一个哥们6点就来了。。Orz 他说昨天他去西站买票,5点多去的,排第九个,轮到他的时候,没票了。。。离9点还有一个半小时,该干点啥呢,奇怪,起的挺早,脑袋倒是挺清醒,拿出手机读读''Hacker's Delight''。

    买票点也挺可气的,一边给排队的卖票,更多的是再给“其他人”出票。排我前面的要了一张票,那人到旁边等着出票,后面的人就上去问到某某某地的车票还有没。售票员说:出票呢,等等。那就等等,虽然大家都很着急。要知道,这时候谁动作快谁就能买到票啊。可是不对啊,票出了,而且出了好几十张,前面那人只要一张啊。。呵呵。总算轮到我了,其实在排队买票换人的间隙,售票员都在疯狂的操作,不停的出票。我是反复问了好几遍才给我查,Z9还是没了,无奈,买动车吧。交钱出票,在出我的票之前,大概出了7张别的票,那人顺手整理一下就放进抽屉里。。。卖给黄牛的话,利润可是好几倍了,这生意,谁都知道该怎么做,就是可怜咱们这些幸苦等待好几个小时的人了。 

    出来去吃早饭,毕竟买到票了,心里少了份挂念,想想鱼儿少一个增氧器,于是决定去附近的花鸟市场买一个。到了那边之后,先去看了看宠物店里面的几只小猫,呵呵,貌似刚睡醒,从精致的小屋里面伸出脑袋不停的往外瞅。回来之后放到鱼缸里面,鱼儿很Happy,都绕着泡泡不停的上下浮动。泡泡把缸底的鱼食也给搅动起来,鱼儿不停的在水底找吃的。。看来给它们增添了不少生机~ 旁边的大乌龟不停的拔动乌龟缸,貌似想往鱼缸那边爬。。。自从给乌龟买了个恒温器之后,它们也活跃多了。来一张照片吧(用30W像素的手机拍的。。) 


     

  • 最近准备一些论文,把语义网络在个人PC桌面管理方面的最新研究进展调研了一下。正式一点的名字是叫语义桌面。自己对这个方向也很感兴趣,有一些相关的论文,但是不是很多。总的来说,就是对个人电脑里面的内容进行语义描述,然后在获得的这堆数据上做处理,提供服务。这么看来,做这个东西,系统设计思路算是比较直观,获取数据,设计核心处理代码(元数据查询、推理),最后就是设计交互式界面。这里的问题是:如何获取语义数据,系统的推理能力究竟有多强。这两个问题其实也是比较相关联的,推理建立数据之上。在设计推理能力上,我目前还没做过实验和测试,在考虑这个问题的时候,需要考虑目前语义网开发的基础设施(工具),要是自己提出的需求超出目前所能获取的这些工具的范畴,那岂不是需要自己去开发一套新的工具,甚至重新定义一套标准,这个工作量就比较大了。还需要考虑性能问题,数据量大的时候(我没测试过,但是性能问题是很显然的),复杂的推理功能势必会和性能搭上关系。当然,还有一个更大的问题,那就是元数据的获取。这个问题,对于语义网开发来说,是一个通用的问题,如何从非结构化的数据当中获取元数据。一个方式是人来做,我一直认为这种方法是可行的,而且我也愿意去做,可是世界上有形形色色的人,有些人就不愿意,何况目前有大量的非结构化数据,因此研究自动获取元数据的方法势在必行,目前在做的,比如从良好的数据源进行入手,像把wikipedia当作数据源,powerset就是拿它做数据源。当然,wikipedia里面更多的是文本,这时候就需要借助NLP、Machine Learning等技术,总之,这是一块比较大的问题。要是能够比较好的解决元数据获取问题,我们用的各种系统会比现在聪明许多:)

    当然,事情可以更进一步。正如把各台孤立的电脑连成网络能产生如今的互联网,把孤立的数据放到一块儿也能干很多有意思的事情。系统产生的元数据本身从设计初衷来看,就是为了方便集成、共享。元数据加上各种技术使得系统更加聪明易用,再在所有人的数据当中进行挖掘分析,又能够获取更多有意思的东西,比如做一些推荐了。商品购物网站,例如淘宝,能够利用Data Mining等技术进行商品推荐,那是在计算机不知道数据语义信息基础之上做的事情,要是系统明白数据的意思,试想会有怎样的效果。

    无论是什么技术,一个共同点是我们的系统越来越聪明。这种发展趋势是非常明显的,也是很显然的。计算机能完成过去由人来做的事情,从而人从琐碎的事情当中解放出来,可以去关注更加High Level的东西,大家都愿意这样。过去把读书笔记写在纸上,要用到了需要想想究竟记在那个地方了,到现在记在电脑里,要看的时候通过搜索等功能,电脑帮我们完成了很多的事情,提高了效率。而以后,应该是电脑能够明白一些简单的做事流程,理解数据的含义,去完成过去我们需要自己去做的事情。Google的搜索根据个人的喜好定制自己的搜索结果,而不是我用了N回,每次都是一样的结果,即使我对某些结果不会去点击一次。

    今晚看Read Write Web,老外在这方面还是做了不少产品的,而且这些产品不少被大的公司使用。在这方面,应该有很大的市场,但是对技术创新也要求比较高。不过没事,有心思了不妨去摸索一把,至少没什么坏处吧:)

    return ; 

  • 2008过去了,2009来了,写这篇日志的时候09年的第一天过去了。今天去实验室呆了会儿,改论文,看看电影,把''Hancock''给看了,比较喜欢Will Smith,喜欢他的表演风格,他的电影,我所看过的,比较推荐''当幸福来敲门''(The pursuit of happiness)。在经历各种生活磨难之后获得成功,这种感觉就如拿到自己想要的offer:)所以经常在BBS的求职版看到推荐看这部片子,尤其是今年的形势。眼前仅仅是眼前,即使获得一时的成功也是暂时的,一时的不顺也是暂时的,人生路很长,做好准备,收获更大的成功。

    同事问我今天为什么在实验室。我笑笑说有点事情要办。今天是节日,难得的3天假期,或许应该好好享受一把,放松一下自己。看怎么看待了。其实现在节日不节日的,对我影响不大,我更是注重的是各种我关注的东西发生了多少质的变化。心被其它的事情牵着,节日不节日的,没什么两样。我更喜欢希望更快的达到目标,但往往欲速则不达,有时候逼迫自己去做,可是大脑却给出相反的信号。好了,现在我不会去刻意要自己怎么办了,有约束,但更注意调整自己,做自己这时候最想做的事情,迸发出最大的潜能。这样才能使自己工作最高效,玩的时候也最“高效”:)

    要学的东西真的很多,想都学会那些自己想学的是不可能的事了。自己需要改变一种学习的驱动方式,虽然我很想掌握自己感兴趣的东西,但是我需要根据某一种驱动来做出选择。当存在多种选择的时候,不妨做一个序列图,然后执行以下拓扑排序,工序就出来了,还能找到关键路径:)这是新年我做的一个改变之一。

    晚上下楼打热水,越下到楼下越感觉冷,感觉和室外没多大差别。宿舍楼里面的暖气片实在太少了。。这也是我在北京进过的建筑里面冬天让人感觉最冷的几个楼之一。好怀念在吉大的日子啊,宿舍里面暖气很足,加上马力全开的四台电脑,宿舍里面就如南方夏初那般。在实验室养了两只乌龟,天天冬眠,记得在吉大养的那只,没看它睡着过,冬天胃口也是超级好。小抱怨一把,也小怀念一把,因为再过半年,无论是暖的还是冷的宿舍,我都不会有机会去享受了。

    return ;

  • 昨天准备用TiMBL分类的数据,发现速度太慢,就用一个分词工具先对文本数据进行分词,分词结果能够让我的工作稍微加快一些。上网调查了一番,C++的中文分词工具有一些,比较有名的是ICT开发的一个工具,想弄到一个最新版的,上的主页看了看,那边提供相应的dll或者so文件,于是想弄到so文件,然后写一点C++代码调用一下就能达到我要的功能了。点击下载发现需要提供一些信息,还得通过一些后续流程才能下下来,于是作罢。直接去找有没有Python的实现。其实这个页面可以获得免费的版本,不需注册,后来才查到的~ 直接问宋大侠有没有推荐的Python工具,告知可以去CPyUG看看。那我还是直接Google吧,找到一个,叫“Python中文分词”,还不错。可惜一开始用的时候存在一些编码的问题,试了试几种编码,还是不行,于是横下心来,抽出半天研究研究Unicode以及本地化相关的内容,看了看C++和Python对Unicode的支持和使用方法。以下网址被我收录到自己的wiki当中:

    • http://evanjones.ca/unicode-in-c.html
    • http://www.librawill.com/wp/archives/240
    • http://evanjones.ca/python-utf8.html
    • http://www1.tip.nl/~t876506/utf8tbl.html
    • http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF
    • http://stuff.vandervossen.net/archive/weblog/2003/07/unicode_in_python
    • http://www.cl.cam.ac.uk/~mgk25/unicode.html *

    其中最后一个打星的网站推荐一下,介绍比较全面。当然,Google一下可以找到很多相关的资料。

    最后看了看glibc以及libstdc++当中关于Unicode部分的代码实现,又一次深切的感受到Source Insgiht的好用~ 代码没有深入研究,所以没什么感受,等打算好好看完之后再写心得吧。

    试了试Sun的VirtualBox,装了最新版的Ubuntu,一直听说他的界面不错,包管理包含Debian里的apt等工具,接下来打算试试最新的Wine究竟做的咋样了,效果好的话,可以考虑不装Windows系统,直接Linux+Wine,其实自己主要的工作在Linux下都可以完成,而且非常喜欢Linux:)若是不理想,可以考虑Linux+VirtualBox或者Windows+VirtualBox,这两种都行。现在是拿Cygwin来模拟Linux环境,不过用Sun的Unix-Center提供的Solaris环境越来越多了,免费,速度快,适合学习和练手。

    return;

  • 好久没写了,简单记录一下:)

    周六和宝宝出去转转,主要是想去秦唐府腐败。。 宝宝顺便去拿韩国代购的化妆品。发现东四大街真是个好地方哇(Note:张自忠站附近那片),好多吃的地方,真是应接不暇,每家看了都想进去品尝一把的冲动,看到了孔乙己酒店,好想进去品尝一把茴香豆和绍兴老酒- - 不知道他家卖的如何。。还有一些涮肉店、糕点店、小吃店,整得我都有想在那边租房的冲动,hiahia。我们一起在那边买了两张煎饼,味道还不错,一个肉松的,一个鲜蘑鸡肉的,怕把肚子填多了,吃不下秦唐府的羊肉泡馍- -! 所以就买了这两个口味的,那个店里还有很多别的口味的。晚饭是在秦唐府吃的,他家做的东西还不错,在吃过的陕西小吃里面算是中上吧,感觉羊肉泡馍还是比如北平羊汤那边的:)里面的稠酒不错,热乎乎的,稍微带甜。宝宝收到化妆品很满意,任务顺利完成,满意而归~

    最近是在忙中期报告,然后是研究一些文本挖掘和机器学习相关的东东,做些实验,另外就是关注后续的户口办理事宜,琐碎的事情比较多~ 上周推掉了易查的终面通知,总体来说还是不错的创业公司,有自己的产品,目前不错的市场份额,搜索,进去之后能够大展拳脚。要是有面试机会的话,对于陌生的公司,我还是非常想去看看的,可惜完美时空和ThougtWorks就没有我的后续流程了。。。上周六参加了人民银行的笔试,考试感觉很正规,从试卷、组织各方面来看,让人感觉非常正规,今年的题目没有往年的Word考题了,基本上都是计算机专业相关的题目,当然我投的是计算机职位,北京这边的部门,3个人,900多人笔试。。Orz 希望自己能够拿到面试吧,想去人民银行那边感受感受。今天是去亚马逊参加了终面,群面加一轮的单面。感觉还不错,第一次去远洋天地,比较大的住宅小区和商业区,离国贸不远。其实8月9号来过一次四惠,是去看奥运羽毛球比赛,一晃过去4个月了,不得感慨一下。亚马逊Office不错,去工程师那片看了看,环境挺好的。HR和面试官也都很nice:)貌似这边也是在等Head count,会比较慢。。我是早上8点左右进地铁。。人那个多啊,热腾腾的,再挤一些我就可以不用用脚站立直接悬空了~

    回来感觉比较累,早起,面试,长时间站立,下午基本上没效率了。最近打算研究研究Apache Http Server的Source Code,细致的剖析剖析。最近也在comp.lang.c++转,计划想好好分析分析gcc特别是g++的源代码,还有libstdc++的代码,总感觉不在编译实现层面去探索一把,而只去看principle或者suggestion没什么意思,分析code的时候再和标准对起来看可能有不错的学习效果。另外Boost也是个好东东,值得研究。。当然终极的是Linux的code。Orz,需要做的工作太多了。。加油!

    return ; 

  • 大摩发offer了,没有我:( 信心不断遭受打击。。Orz

    过去写过一篇日志,简单说了说摩根IT的AC,今天那边也发offer了,虽然对我来说没有最终拿到offer,不过也算是一个流程结束吧,自己想想还是把面试的过程记录下来,给自己留个记录,也给后来人一些参考:)

    投投行的IT,一开始自己就没多少的把握,不怎么了解,感觉总是跟金融沾点关系。所以投了之后也没仔细想过要怎么样,总之不像投微软那样有信心。不知道那边招怎样的人,技术要求又如何。唯一知道的一点消息就是做技术投行IT不是首选,但是待遇确实很吸引人。可能了解过的人也都知道,18W的base加7W的bonus,很吸引人吧:)其实还有别的吸引人的地方,比如高档的办公环境,如雷贯耳的公司,国际化的团队。。我是喜欢海投的,而且喜欢体验不一样的经历,所以就投了,巴克莱、UBS和大摩的IT都投了,哎,唯一遗憾的就是没投高盛的:)

    巴克莱IT和UBS都需要做一个SHL测试,我都挂在了他们的SHL测试上,UBS的直接是英文题目,而且题目是关于经济相关,虽然仔细看看题目其实比较简单的计算,不过对于我来说,理解起来比较慢,毕竟是E文的,而且是经济数据,平时接触不多,都挂了。后来对大摩的也没怎么想过怎么样。后来参加了北大的那场笔试,依然记得很清晰,做了1个小时20分钟,交卷,赶往北航参加腾讯的。腾讯的在门口卡住我:不是我不相信你,你能证明一下你刚才去干了吗?我是找了一个借口说有事迟到了- -b 我说给我1个小时就可以,不会耽误你们时间,对方说:1个小时,我们的可是2个半小时的卷子。。最后考上了,也面上了,谁知道面试就是10分钟草草收场,问了杂七杂八的东西,而且面试严重不准时,自己在外面等了将近1个半小时。。FT。

    其实做完大摩的卷子感觉基本上没希望了,卷子内容记不太清了,涉及概率、数学、C++基础、简单的数据结构等。我还记得其中一道题目我是用到了积分求面积。。笔试的题目后来在面试中也被问了。题目是将给定链表的后N的元素删除,我在卷子里面的解法比较耗时一些。。后来面试的时候给出了更快一些的方法。反正题目都不难,但是对前面的概率题目不怎么好。

    不过出人意料的是给我面试机会了。确切的说是电面。一周之前预约好了时间,一周后电话准时打过来,很准时:)电面内容比较简单,可能更多的考察口语,幸亏我口语也还不错。电面主要问了C++(虚函数表,多态,模板等)、两道算法题(看我简历写着有参加竞赛经历,一道好像是在一个整数数组里面找出所有数对,使得和位给定的值M,Hash的解法和排序的解法都给了,另外一道忘了)、数据库、设计模式、项目。时间30分钟。面完感觉还不错,因为也不难,口语没什么表达障碍,后来就是顺利收到了参加AC的通知~

    其实参加AC之前自己想过不想去了,百度和有道的失利让我比较丧气,心里想着:还要买西服,还要一大早赶到银泰中心。。累,折腾。后来宝宝鼓励我还是去试试吧,自己想想毕竟也是一个机会,也应该争取一下。去了,回来感觉还是非常值得的:)

    那天我是迟到了,路上有点堵车,不过也是赶到正式面试开始之前。Mike告知大家可以报销来回路费,很赞~面试之前一位黑人的HR MM给我讲了讲面试的流程和职位介绍,期间问了问我们都来自哪些学校,才知道原来上午这场是科苑专场。。全是科苑的。。面试的流程是:先是Group Interview,然后是两场Tech Interview和一场Professional Interview。其中后三场每个人的情况不一样,有的是Professional在前面。

    Group Interview是6个人一组,让设计摩根IT的Logo,大概有10来个面试官在看着我们,一开始自己有点紧张。。不过后来就没啥了,反正多讨论,理清问题是啥,需要做啥,注意点时间。自己不算突出,组内有几个哥们表现异常活跃。。这个流程大概25分钟,最后5分钟每个人做一个简单的总结。结果大家弄错了,以为每个人有5分钟的时间,结果一个哥们没说上。。。Group Interview一般般,不知道面试官考察啥。

    接下来我的流程就是两轮的Tech面试,每轮45分钟,期间有15分钟的break。第一轮是一个HK的哥们,很nice,整个过程一点压力都没有。应该说我的面下来,感觉都很轻松,面试官的态度都很好,说对了会不停的赞扬~第二轮貌似是来自日本的哥们,面试开始大概10分钟又进来一个女面试官一起面。两轮技术主要是根据自己简历写的来问,我主要问了虚函数表、虚函数的实现、内联、AVL树、B树、设计模式、数据库、OS的死锁等。都很简单。。我在前面也K了这么多家公司了,不惧怕这些了。。所以感觉技术面应该还算不错。

    最后一面是Professional面,是一位上海office的面试官,主要问了项目,问了一些性格方面的问题。期间突然掏出手机说他觉得手机是黑的。。我看了看不是,好多地方是银色的。。这个问题比较奇怪,难道是考察我是不是有主见、不怕权威?呵呵,那个手机不错:)

    面完了,期间补充了点糕点和咖啡。北京的office不错,挺喜欢的- -b 最后大家出来让等等,大概等了15分钟,结果一个人被叫走了,其他人都让回来等消息。。我们都还以为是叫去吃大餐了,根据往年的传统。大家都有点失落,不过出来的时候也都挺高兴的~一次不错的体验。其实后来知道不是,从被叫去的人知道,好像是加面,说面试官可能觉得了解还不够,或者意见不统一。具体不知道了。。

    后来就是等待了,按照传统是AC第一天的10天后给消息 。今年稍微有点慢,据说是赶上感恩节的缘故。。可能跟危机也有关系吧。。反正自己是被reject了。结果不理想,不过过程还是挺好的~摩根注重人的全面表现,不仅仅是技术吧,综合考虑。不过去面试自然一点就行,好好发挥,自己感觉OK就行,中不中就是看缘分了:)

    OK,就这些了。求职经历给了我很多新的感受,虽然很辛苦,但是也让自己知道了很多,辛苦也是值得的~祝所有人好运。

    return ; 

  • 简单记录一下吧。。

    今天完成了完美的所有题目,发过去了。那边反应也很快,立即给了回复,表示收到了。。传说摩根今天发offer,不过貌似没有发,BBS只有大家讨论的帖子,没有报offer的帖子。复旦BBS貌似有人跳出来报offer,结果我去找帖子,没了。。也许真的没发吧。其实我也不怎么在意这个了,是自己的逃不了,不是自己的再盼也没用:)静心做别的事情吧~

    下午和ZC去打了会儿羽毛球,差不多半个月没打了~ 下午有几个球动作比较大,差点把脚给扭着了,不过没大碍。以后还是小心一点,动作一做大就容易受伤,可能动作也是不规范。练习了一下扣杀,爆发力还是不行,可能动作也是不正确,就只有一个自己挺满意,后退中起跳杀的,声音感觉不错:D 在忆石见过几个打得猛的,起跳扣杀姿势比较专业,而且看上去爆发力很好,自己打得时候貌似还是没有掌握好手腕的运用,力量不够集中,再体验体验吧~

    return;

  • 哇,今天再去中关村软件园!发现那边真的很大哇,加上自己弄不清路线,结果从钻石大厦到环宇大厦花了半个多小时,面试迟到了。。。

    环宇大厦很新,里面环境不错。哇,IBM环宇大厦那边好多人啊!还看到好多Apple电脑。。

    面试官很nice,主要问了Linux相关的问题,我还算应付的不错。但是感觉自己想做的和职位做的东西不怎么匹配。

    哇,下午收到了亚马逊的通知,告知我通过面试了,至于下一轮的具体安排呢。。等电话吧 Orz

    return;

  • 为啥我每次去清华科技园面试都是感觉发挥不太理想。。有道是自我感觉良好,可是结果不理想:( 

    今天啃叱啃叱的继续做完美的作业,理论和实践还是区别挺大的。今天把程序完善一下,把进程通讯、同步都用上了,结果算是挺理想了。晚上回来想了想最后一题的思路,要用到线程、互斥锁和信号量,可能你能猜到要写啥了,哈哈,就是实现一个非常经典的模型,对多线程编程熟的话不费吹灰之力。。

    下午接到了IBM的面试通知。记得去年就和宝宝一起去了趟IBM,那时候是宝宝去应聘人力职位。告知是在环宇大厦,貌似是新楼,搬进去没多久,刚好去参观参观:) 我得为路上准备2.5个小时的时间- - 用mapbar查了查公交路程,一共26KM。。还是早点出发的好,到那边还得找大楼在哪儿。祝自己好运~

    return; 

  • 真的想早点结束求职的日子。。今天做了一天题,完美时空发的。现在应聘流行做题目,豆瓣、ThoughtWorks和完美时空,都要求交个代码回去review。而且完美的题目还不止一道。。看上去都挺简单,但是技术的东西仅仅看看凭感觉是不行的,下午写socket就忘了将port先字节序转换一下折腾了半天。。想想也是近几年头一次用socket吧 囧rz

    周六陪宝宝去了趟天津,有考试。天津到处都在修路啊。。导致我查找好的路线,由于公交改道或者临时取消,结果基本上查的路线没什么用。。这次从天津回来,我的一个想法就是:不去天津那边生活,还是北京舒服。。两次打车,感觉司机都在试图忽悠我们,幸亏事先我查过路线,知道一些,而且这次去坐公交,实在太猛了,车开的狂快,我在前面看着有点胆战心惊,而且公交是那种随叫随停那种,不按照站台停。也许我过去都是在南开天大那边转悠的缘故吧,感觉还挺好。天津站修的不错,像个机场似的。京津城际高速列车速度很快,可是坐着坐着我怎么心里发毛,而且那种忽上忽下的感觉让我觉得有点恶心。。看来我还是不适合坐高速的东西- -!

    昨天去面试了易查,一位副总裁面的,谈得还行,那位面试官给我的印象不错,很直白。我喜欢直白,没什么拐弯抹角。面试计划是4:30开始,结果我一直等到5:40。。。这次谈涉及的开发经验比较多,我这方面比较欠缺。面试官也很直接,我的理论功底很好,但是在项目经验上,特别是服务器端开发经验很欠缺。是啊,因为我基本上没做过服务端开发,但是我喜欢服务端开发,想做大规模数据处理以及高性能服务程序开发,过去几年的学习基本上都是为这个方向准备的。最后面试官也很干脆,先让我等等,可能会有后续面试,然后我就出来了。

    上周六经历了IBM异常“冗长的”的笔试。。来来回回发卷、收卷N回。。Orz 连那些发卷的人都嘟哝了一句:真烦。。前面一大部分是测试个人非技术相关素质的,就是考速度。可怜我弄错了题号,第一部分15题,然后从16题开始答第二部分,第二部分卷子又是从1开始编号,结果做完10题发现答题卡的题号是24。。。晕了。第二大部分技术题目全是选择,C++的题目考的挺细的~

    今天收到搜狐研发中心的面试通知了,原先还以为没啥希望了。这个研发中心估计就是搜狗那边的职位,我决定继续发扬艰苦卓绝的求职作风,明天决定杀过去看看。。。

    return;