<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet href="/xsl/rss.xsl" type="text/xsl" media="screen"?>
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:ppp="http://blog.sohu.com/rss/module/ppp/"
	>

	<channel>
		<title>恋恋东风</title>
		<link>http://pssure.blog.sohu.com/</link>
		<description><![CDATA[恋恋东风]]></description>
		<pubDate>Tue, 16 Oct 2007 00:29:05 +0800</pubDate>
		<generator>搜狐博客</generator>
		<ppp:ebi>c2a7f05792</ppp:ebi>
		<image>
			<title>http://blog.sohu.com</title>
			<url>http://js.pp.sohu.com/ppp/blog/images/common/logo_150_60.gif</url>
			<link>http://blog.sohu.com/</link>
			<width>100</width>
			<height>43</height>
			<description>搜狐博客</description>
		</image>
		<item>
			<title>断电记</title>
			<link>http://pssure.blog.sohu.com/67336855.html</link>
			<comments>http://pssure.blog.sohu.com/67336855.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Tue, 16 Oct 2007 00:29:05 +0800</pubDate>
			<category>杂记</category>
			<guid>http://pssure.blog.sohu.com/67336855.html</guid>
			<description><![CDATA[<p>&nbsp;&nbsp; 照理停电是要有通知的，可也有意外的时候，今早上我在篱笆网上搜寻星海泳票，看到一帖说便宜卖了，60元8张，合计一下超便宜，正心里窃喜赶紧下手。乎----屏幕一黑，那一瞬间，我几乎是愣了足足有5秒钟，看到大家都站起来，才回过神，我的泳票啊......</p>
<p>&nbsp;&nbsp; 电反正是停了，也没啥其他好想的了，该干嘛就干么吧。我和yy去了xfdeng实验室，大家商量出去逛逛，xfdeng说去sabai house坐坐，不过那会儿快到吃饭时间了。最后我们三个一致带上论文说是出去逛逛看论文。去就去呗，就当我们拎着装着论文的袋子走到楼下时候，电梯亮了，又来电了，那会儿真是不晓得是回去呢还是出去，三个人傻愣五分钟后还是出去了，就在校园里溜达，沿着我们走过无数的道路走着，穿过怡远楼，就在图书馆前面的大草坪坐下来了。也没按照计划拿出论文，而是在那儿唠嗑，不过倒是享受到了难得的午前阳光。刚出来时候天还是阴沉沉的，慢慢地阳光就从雾霭中透出来，越来越亮，虽然不如夏天的那么毒辣，晒多了也烤人。</p>
<p>&nbsp; 下午电倒是来了，可是由于理工楼的路由器坏了，还是上不了网，直到三点多才通网，我急急地上篱笆网看，帖子都没有了，唉，无缘啊！</p>]]></description>
		</item>
		    
		
		<item>
			<title>无题</title>
			<link>http://pssure.blog.sohu.com/64831419.html</link>
			<comments>http://pssure.blog.sohu.com/64831419.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Sat, 22 Sep 2007 22:06:24 +0800</pubDate>
			<category>杂记</category>
			<guid>http://pssure.blog.sohu.com/64831419.html</guid>
			<description><![CDATA[<p>&nbsp;&nbsp;&nbsp; 线上偶然碰到sanking shi师哥，他还是一样很&ldquo;能说&rdquo;，问我学习，工作，毕设等等。<br />我最近感觉事情很多，关键是很乱，就和师哥聊了好多，我们一会用中文，一会儿用蹩脚的英文，相谈甚欢。<br />其实他毕业后我就没见过他，虽然只是在上海，或许他也回来过，其实说真的我还蛮想那两个师兄的。</p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;记得刚入学那个暑假被导师提前安排到学校，第一次开会的时候，就是那两个师兄做汇报。至今给我的印象都很清晰，sanking那时候还留着长头发，卷卷的，很能说；相反，宫师兄一副很憨厚的样子，一着急就容易打愣。一个暑假下来，一起吃饭一块儿玩，混得就蛮熟的了，最记得宫师兄老爱管QQ叫&ldquo;qiuqiu&rdquo;，我一听就想^_^，还屁颠屁颠跟着sanking去游泳。还有一个陈静，许兰师姐，不过那会儿还不是特熟，只是经常在一起玩，后来静师姐和宫师兄成了一对，小两口一起在杭州发展喽！</p>
<p>&nbsp;&nbsp; &nbsp;过了那个暑假我们就搬到理工楼了，和理工楼的师兄师姐们都不是很熟，交际圈只是局限在我们年级一帮人了。偶尔回凌云楼开会才会去聊会儿。<br />&nbsp;&nbsp;&nbsp; 今天由于刘瑜师兄结婚，两个师兄才都回来了，感觉变化也不大，sanking的头发没那么长了，不过还是很帅的；宫师兄一紧张还是容易犯愣，静师姐仍旧大大咧咧，和宫师兄还挺互补的，嘻嘻！</p>]]></description>
		</item>
		    
		
		<item>
			<title>一首歌因为它背后的故事而更加动听</title>
			<link>http://pssure.blog.sohu.com/56171678.html</link>
			<comments>http://pssure.blog.sohu.com/56171678.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Sat, 21 Jul 2007 14:17:31 +0800</pubDate>
			<guid>http://pssure.blog.sohu.com/56171678.html</guid>
			<description><![CDATA[<p>&nbsp;&nbsp;&nbsp;&nbsp;有一种爱叫做放手</p>
<p align="left"><embed style="FLOAT: left; MARGIN: 0px 10px 10px 0px" src="http://vhead.blog.sina.com.cn/player/outer_player.swf?auto=0&vid=5425795&uid=1272941770" width="400" height="300" type="application/x-shockwave-flash" loop="false" autostart="false"></embed></p>
<p>&nbsp;&nbsp;&nbsp; </p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;&nbsp;&nbsp; 当小猎人放这个MTV给我看的时候，我还挺不以为然的，可是我很容易就会被感动，当看到男主人公被打倒在地，但却仍然坚持不说出自己病重的真相；当女孩和别人结婚时候，镜头移到男主人公的坟墓上，我还是热泪盈眶了。</p>
<p>&nbsp; 其实这首歌唱得并不怎么样，更不是我喜欢的类型，但因为它背后一段感人的MTV，听着歌声，想得却是那段刻骨铭心的感动。</p>
<p>&nbsp; 说到超级经典的感人的MTV，不能不说韩国的《kiss》，每看一次都会哭一次。</p>
<p align="left"><embed style="FLOAT: left; MARGIN: 0px 10px 10px 0px" src="http://vhead.blog.sina.com.cn/player/outer_player.swf?auto=0&vid=345957&uid=1268705251" width="400" height="300" type="application/x-shockwave-flash" autostart="false" loop="false"></embed></p>]]></description>
		</item>
		    
		
		<item>
			<title>搬宿舍&#8212;&#8212;累，就一个字</title>
			<link>http://pssure.blog.sohu.com/55864079.html</link>
			<comments>http://pssure.blog.sohu.com/55864079.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Thu, 19 Jul 2007 13:17:52 +0800</pubDate>
			<category>杂记</category>
			<guid>http://pssure.blog.sohu.com/55864079.html</guid>
			<description><![CDATA[<p>&nbsp; 前阵子妹妹来苏州玩，再加上自己正好有些事情忙，所以也没上blog上看看。</p>
<p>&nbsp; 就在那些天中的一天早晨，一睁开眼，发现头晕得很，但不是很厉害，真怕又像几年前一样，莫名其妙地天旋地转。我想好好休息几天，就趁着送妹妹回家就偷偷地溜回家了。回家几天，头晕倒是还好了，偶尔起床时稍微有点晕，不过身子感觉很虚。</p>
<p>&nbsp; 18号是搬宿舍的最后期限，在家舒服地待了三天无奈又回来了，昨天中午开始收拾东西，那些零零碎碎的东西放在那儿还好，收拾到一块儿才猛然发现，竟有如此多，装了一袋又一袋，车子堆得满满的，也佩服拉车人装车的水平，大大小小的东西，哪个角落都不浪费。也真不巧，昨天天气狂热，38度的高温，烤人的阳光，又晒又热。多亏有lc和小猎人帮帮忙，我们实验室的同学关键时刻都还是挺出力的，很赞！</p>
<p>&nbsp; 到晚上六点差不多都搬好了，吃完饭后又回去整理。累了一整天，出了多少汗，我都无暇顾及了，也尽量不去闻身上的汗味。等都弄好，坐下来吃了点水果，吹了会儿风，都十二点半了。洗澡时候发现胸口都焐得出了好多红疙瘩。洗完澡后，累得很快就睡着了。</p>]]></description>
		</item>
		    
		
		<item>
			<title>爱情 忘情汤</title>
			<link>http://pssure.blog.sohu.com/52649325.html</link>
			<comments>http://pssure.blog.sohu.com/52649325.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Thu, 28 Jun 2007 09:45:27 +0800</pubDate>
			<category>杂记</category>
			<guid>http://pssure.blog.sohu.com/52649325.html</guid>
			<description><![CDATA[<p><font face="宋体"><font face="宋体"><font face="宋体" color="#cc33ff">在《暗算》中，安在天给黄依依讲了这样一个故事：</font></font></font></p>
<p><font face="宋体" color="#cc33ff">在阴阳之间住着一位老婆婆，她每天都在不停的煮一锅汤，去阴间的人必须都要喝一碗她煮的汤，听说这种汤有个名字叫忘情汤，喝下去就可以忘记阳间时的一切情感了．</font></p>
<p><font face="宋体" color="#cc33ff">然而有一个年轻人，始终不肯喝这碗汤</font></p>
<p><font face="宋体" color="#cc33ff">老婆婆就问他为什么？他说，他不想忘记他曾深爱过的那个女人．</font></p>
<p><font face="宋体" color="#cc33ff">后来，老婆婆就只好施了魔法，让他喝下了那碗汤！</font></p>
<p><font face="宋体" color="#cc33ff">又一个轮回，那年轻人又来到老婆婆这里</font></p>
<p><font face="宋体" color="#cc33ff">老婆婆问他，年轻人，你可否还记得你曾经深爱的那个女人嘛？</font></p>
<p><font face="宋体" color="#cc33ff">青年回答说，我不记得曾经深爱过哪个女人，但我记得今生最爱的那个女人．</font></p>
<p><font color="#cc33ff">老婆婆感叹到：爱情这东西真的还是那么脆弱，甜的时侯比甘蔗还甜，苦的时候比黄蓮还苦。可仅仅喝下一碗汤，就什么都没有了！</font></p>
<p><font face="宋体" color="#cc33ff">其实这所谓的忘情汤就是时间，时间也许不能改变什么，但它肯定可以令人遗忘！！</font></p>
<p><font face="宋体" color="#cc33ff">时间，随着时间的流逝，人的记忆也会淡化，一段感情如果淡化的话，那还会是爱嘛？</font></p>]]></description>
		</item>
		    
		
		<item>
			<title>暗算</title>
			<link>http://pssure.blog.sohu.com/52225333.html</link>
			<comments>http://pssure.blog.sohu.com/52225333.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Sun, 24 Jun 2007 22:14:03 +0800</pubDate>
			<category>杂记</category>
			<guid>http://pssure.blog.sohu.com/52225333.html</guid>
			<description><![CDATA[<p>当在ppstream看了《暗算》的一集，就忍不住看了第二、第三、、、、现在每天晚上都守着看。</p>
<p>电视剧《暗算》分三个部分，分别是&mdash;&mdash; </p>
<p>　　第一部《听风》</p>
<p>　　第二部《看风》</p>
<p>　&nbsp; 第三部《捕风》 </p>
<p>　　听风，即无线电侦听者；这是一群&ldquo;靠耳朵打江山&rdquo;的人，他们的耳朵可以听到天外之音，无声之音，秘密之音。</p>
<p>　　看风，即密码破译的人；这是一群&ldquo;善于神机妙算&rdquo;的人，他们的慧眼可以识破天机，释读天书，看阅无字之书。</p>
<p>　　捕风，即我党地下工作者。</p>
<p>网上评论很多，大多都如是说：</p>
<blockquote style="MARGIN-RIGHT: 0px">
<blockquote style="MARGIN-RIGHT: 0px">
<p><br /><em>看完暗算，我发现自己已经深陷其中，不能自拔。</em></p>
<p><em>成天脑子里想的就是钱之江和安在天，&nbsp;暗算的情节不停在脑子里盘旋。 </em></p>
<p><em>觉得干别的都没意思，就想看暗算。 </em></p>
<p><em>看见&quot;密码&quot;之类的词语就会激动。</em></p>
<p><em>后悔没考数学系。</em></p></blockquote></blockquote>
<p>诸如此类的话。<br /></p>]]></description>
		</item>
		    
		
		<item>
			<title>&#8220;计算&#8221;和&#8220;语言&#8221;【转贴】</title>
			<link>http://pssure.blog.sohu.com/51321673.html</link>
			<comments>http://pssure.blog.sohu.com/51321673.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Tue, 19 Jun 2007 09:55:35 +0800</pubDate>
			<category>转载</category>
			<guid>http://pssure.blog.sohu.com/51321673.html</guid>
			<description><![CDATA[原文链接：<a href="http://blog.sina.com.cn/u/4cbec5e90100089n" target="_blank">http://blog.sina.com.cn/u/4cbec5e90100089n</a><br /><br />两位网友的评论（参见附录）提出了一个令人无法回避的严峻<a href="#" target="_self"><u><strong>话题</strong></u></a>：&ldquo;<a href="#" target="_self"><u><strong>语言学</strong></u></a>究竟能为<a href="#" target="_self"><u><strong>中文信息处理</strong></u></a>做点什么？&rdquo; 
<p align="left">&nbsp; &nbsp;在过去三年的&ldquo;<a href="#" target="_self"><u><strong>自然语言处理</strong></u></a>青年<a href="#" target="_self"><u><strong>学者</strong></u></a>研讨会&rdquo;上，三四十位青年学者，只有香港的邝蔼儿是语言学背景的，在今年四月的南宁&ldquo;中文信息信息处理战略研讨会&rdquo;上，二十多位专家中搞语言学的只有香港的邹嘉彦教授（邝蔼儿的老师）。<a href="#" target="_self"><u><strong>计算语言学</strong></u></a>是典型的文理交叉的学科，何以&ldquo;计算&rdquo;独大，而&ldquo;语言&rdquo;式微呢？在此，我作为一个计算机背景的自然语言处理<a href="#" target="_self"><u><strong>研究</strong></u></a>者，谈谈我对这个问题的粗浅思考，与大家共勉。</p>
<p align="left">&nbsp; &nbsp;（1）研究普遍规律</p>
<p align="left">&nbsp; &nbsp;计算机研究者关心的是能够覆盖大多数语言现象的通行规律，能够用规则描述出语言现象的规律最好，实在不行，用穷举的方式同样可以解决问题。而不少语言学研究者关心的往往是特例，比如对某个词的某个特殊用法的诠释。对特例的研究有时是有趣的，是能够展示文人学养的，但是和计算机研究者的需求南辕北辙。在&ldquo;全国计算语言学联合学术会议论文集&rdquo;上，往往开头的若干篇都是语言学研究者的论文，搞计算机的人一般不喜欢听，因为搞计算机的人看不出对个别语言现象的玩味到底有什么实际价值，因为很多个案在数百兆的语料库中也不会出现一次，是可以忽略不计的。</p>
<p align="left">&nbsp; &nbsp;搞语言学的人随口说出几个语言上的特殊例句就能把计算机研究者开发了几年的系统难倒，但其实搞计算机的人是用在大规模语料上的整体准确率作为评价结果的，对于很多应用能够达到90%以上就认为很不错了。这种基本评价尺度的差别让双方不容易想到一处。</p>
<p align="left">&nbsp; &nbsp;我们不能说对个案的研究就完全无用，如果是&ldquo;解剖麻雀式&rdquo;的，透过个别现象看到了语言的一些通行的本质，我觉得是很好的研究。次一等的，能够把某个词汇的各种用法&ldquo;无遗漏地&rdquo;穷举式描述出来，也是对自动处理有帮助的。倘若只是就事论事，缺乏归纳，又浮光掠影，没有全面具体的描写，恕我愚钝，实在看不出这样的研究对现实，对未来到底有什么用，而无用的研究是迟早要退出舞台的。</p><br />
<p align="left">&nbsp; &nbsp;（2）站在机器的角度考虑问题</p>
<p align="left">&nbsp; &nbsp;语言学有两大用处，一是用于教学（包括母语教学和外语教学），二是用于自然语言处理。汉语和以英语为代表的印欧语系的撞击让我们更好地认识了汉语的特质，而计算机形式语言与人类自然语言的撞击更是让我们能够站在机器的角度重新认识早已习以为常的语言，这是语言学<a href="#" target="_self"><u><strong>发展</strong></u></a>的一次历史性机遇。</p>
<p align="left">&nbsp; &nbsp;用于教学的语言学是将给人听的，你可以以具有基本常识的人为对象，只要把道理解释通就可以了。用于计算机处理的语言学是必须面向机器的，机器没有常识，没有情感，它只能够<a href="#" target="_self"><u><strong>区别</strong></u></a>不同的符号，对符号进行排序等，在机器的眼里，&ldquo;鲜花&rdquo;和&ldquo;牛粪&rdquo;只是两个不同的符号而已，机器没有背景知识，既不会联想到香气，也不会联想到臭气。因此，如果语言学研究者想做计算机处理，就必须注意&ldquo;符号化&rdquo;，而不能停留在用自然语言对自然语言进行解释的阶段，在计算语言学领域工作的语言学研究者应该懂数学，懂计算机，懂得越多，就越能够和搞计算机的人&ldquo;对上茬口&rdquo;，而不会&ldquo;各说各话&rdquo;了。</p>
<p align="left">&nbsp; &nbsp;（3）统计方法的弱点</p>
<p align="left">&nbsp; &nbsp;两位网友多提到计算所的机器翻译系统从规则改为统计后，取得了很大的提高，因此感到规则方法的无效，语言学研究者的无用。但据我所知，也有反例，比如东芝中国研发中心的王海峰博士，他在东芝主持的机器翻译研究仍是以规则为基础的，他们一直有数名语言学背景的员工在机器翻译第一线工作，今年又新增两位从海外归来的语言学研究人员。东芝比较低调，但他们的翻译系统是非常出色的，在国际博览会上受到国际学者的充分肯定，在ACL和MTSummit上连续发表文章。现在的潮流是统计占有优势，因此做基于规则的方法不容易发表论文，但这并不意味着规则方法已经过时。规则是人的智慧的结晶，深刻而灵活，自有它存在的价值。</p>
<p align="left">&nbsp; &nbsp;短期内评测的成绩不能够决定未来的方向，凡事走到一个极端的时候就会回归了，统计的方法有一些明显的弱点，举例而言，在10万字的语料中你看到了1000个不同的词，那么当语料扩大一倍，即达到20万字的时候，你可能看到了1200个词，语料增加100%，而新的语言现象可能只增加了20%，当语料庞大到一定程度，再翻倍增长已经很难，即使翻倍增长，新的语言现象可能已经降到只增加1%以下，油水越来越少了。语言学的作用就是对语言的处理从统计方法所利用的字词表层推向语法语义深层，每深入一层，就能够大幅度地对语言实例进行归纳，也就能够大幅度地较少对语料库规模和计算规模的无节制的依赖。台湾苏克毅老师是最早开始从事统计自然语言处理的国际知名学者，但他在<a href="#" target="_self"><u><strong>演讲</strong></u></a>中却用一个生动的比喻指出盲目信仰统计方法的可笑之处，他认为停留在语言表层的统计方式方法是在爬树，尽管目前爬得很高，但机器翻译的目标是登月，完全依靠统计是无法实现机器翻译的目标的。</p>
<p align="left">&nbsp; &nbsp;统计的方法还有一个要穴就是研究者在统计方法面前比较被动，用统计方法作出一套系统，输入一个句子进行测试，如果效果不佳，即使是开发者本人也无法解释其中的原因，因为所有的参数都是自动计算出来的，人可控的余地很小，只好更换或追加语料库，或者调整统计方法，即使如此能不能修正原先的错误也很难说。于是，就有人开始打补丁，也就是在统计方法做出结果后，再用一些针对性的规则把一些明显的错误修补一下，这只能说是一种权宜之计，如果换了统计方法，错误类型也会改变，补丁程序也要跟着换，非常麻烦。</p>
<p align="left">&nbsp; &nbsp;（4）提出新的语言模型</p>
<p align="left">&nbsp; &nbsp;苏克毅老师还有一个很精彩的比喻，他说语言模型的框架还是要人来定，语言模型中的参数由机器来算。比如人说语言是&ldquo;圆&rdquo;的，机器就按照&ldquo;圆&rdquo;的形状从语料库中算出半径来；如果人说语言是&ldquo;三角&rdquo;的，机器就按照&ldquo;三角&rdquo;的形状从语料库中算出三角形的各边边长。要机器自己从头分析语言的总体轮廓太慢了，而且容易走偏，因此语言的大体轮廓一定要由人给出。</p>
<p align="left">&nbsp; &nbsp;语言是纷繁复杂的，即使是&ldquo;圆&rdquo;的也不可能是&ldquo;正圆&rdquo;，一定是椭圆，而且边不可能是光滑的，是要有毛刺的，这些毛刺，这些细碎的参数靠人来整理是无法做到的，可以由机器来完成。还有人认为做一个系统可以用数量不多而非常管用的规则（所谓&ldquo;管用&rdquo;包括覆盖率和正确性）作为基础，然后再用统计方法。无论怎样，我赞同语言学的价值在于对语言本质的深入把握，建立起更符合语言真实情况的模型来。目前的统计模型，比如N元语法是建立在大量简化假设的基础上的，与语言的本质相去甚远。对人类语言的形式描述处在婴儿状态，一切才刚刚开始。</p>
<p align="left">&nbsp; &nbsp;（5）利用计算机工具研究语言</p>
<p align="left">&nbsp; &nbsp;语言学研究者应该充分利用计算机研究者的工作成果，展开语料库语言学的研究。北京语言大学的宋柔老师做过一个从语料库中检索语言现象的软件，利用这个软件，语言学研究者能够快速地找到一个词或者多个词在语料库中出现的各种各样的真实现象。</p>
<p align="left">&nbsp; &nbsp;有了计算机，以往摘录语言现象卡片的工作方式，通过个人语言经验内省编撰词典的方式已经过时。一个人的阅读量和<a href="#" target="_self"><u><strong>记忆</strong></u></a>量无法和海量语料库系统相提并论。为什么人写的规则不如机器统计出来的效果好？原因就是一个人的语言经验太有限，无法全面地精密地把语言的规律总结出来。有研究表明，即使是最权威的《现代汉语词典》，其中对词条的解释都远远不够，比如《现汉》对某个词给出了10种解释，但是语料库中可以轻松地找出20种以上的不同解释。</p>
<p align="left">&nbsp; &nbsp;人的优势在于思辨、归纳、推理，而不在于存储和记忆。单凭个人的语感，无论是怎样的天才都无法全面的把握整个语言现实，而我们又不能够指望把海量语料库扔给计算机，计算机就能够自学成才。唯一的道路就是语言学研究者利用计算机研究者开发的语言处理工作更有效地去观察语言现象，更全面而深刻地去把握语言的本质。</p>
<p align="left">&nbsp; &nbsp;（6）建立自然语言处理的理论体系</p>
<p align="left">&nbsp; &nbsp;有不少搞计算机的人去从事生物信息学，他们对我反映说生物学的门槛很高，他们无法离开生物学专家的指导而独立工作，因为计算机算出来的结果是否正确需要生物学家的鉴定。我们搞计算机应用的都是把计算技术和某个领域结合在一起，计算语言学，不妨仿造&ldquo;生物信息学&rdquo;，也可以叫做&ldquo;语言信息学&rdquo;吧，为什么没有形成计算机研究者对语言学研究者的依赖呢？没有形成瞎子背瘸子式的互补型合作呢？其中一个原因是，语言学的门槛太低，我认为语言学至今仍然是一门稚嫩的学科，没有完整的理论体系，更没有严密的数学基础，这样任何一个受过高等教育的人基本上都可以凭借自己掌握的基本语言学只是自己搞自然语言处理的研究了。</p>
<p align="left">&nbsp; &nbsp;先贤们对语言进行形式描述的巨大努力推动了数理逻辑和形式语言的发展，而人类语言依旧无法描述。十年磨一剑，目标是劈开语言的巨石，然而语言巨石纹丝不动，剑走偏锋顺势砍倒了巨石周围的灌木。扫清周围的障碍也不错，让我们看清了语言这块巨石，认情了磨剑的徒劳，开始设计炸药。自然语言处理是&ldquo;入门容易深造难&rdquo;，由于没有系统的理论基础，任何人凭着自己的至少20多年的语言实践，找一些机器学习的算法就能够进入我们的领域，而且还能够取得不俗的战果，我们的地盘，计算机研究者和语言学研究者的联合家园&ldquo;计算语言学&rdquo;在没有任何樊篱的情况下，随时可以被邻人&ldquo;侵入&rdquo;。当然，可悲的是，闯入者也走不了太远，他们也很快会陷入这个缺乏理论基石的泥潭而无法自拔，这就是目前的现实。</p>
<p align="left">&nbsp; &nbsp;（7）心理实验加计算模拟</p>
<p align="left">&nbsp; &nbsp;要建立新的可计算的语言学框架，构造新的融规则与统计于一炉的语言模型，我们应该从何做起呢？我最近的兴趣落在&ldquo;认知语言学&rdquo;或者叫&ldquo;心理语言学&rdquo;上，我非常赞同用实验<a href="#" target="_self"><u><strong>心理学</strong></u></a>的手段去探测人类对语言信息进行加工推理的过程，然后再用计算机去模拟验证。任何既有的语言学理论利用都应该在心理实验和计算模拟面前重新接受检验。这条路线一石两鸟，既有利于揭开语言学的面纱，有浓重的科学味道，又能够催生新型的语言处理软件系统，兼具工程技术的价值。</p>
<p align="left">&nbsp; &nbsp;以往的语言学，常常是用自然语言解释自然语言的，太模糊，存在太多歧义，无法用计算机实现，也就无法验证，无法验证也就不能成为&ldquo;实证科学&rdquo;，就会陷入文人之间没有客观评价尺度的争论，让搞计算机的人在旁边看着，如堕五里雾中，无所适从。语言学的研究成果必须经计算机模拟实验，用真实的语料进行验证，而不能停留在类似文艺中的学术论战上，因为语言学不仅具有人文的背景，更有科学的内涵。</p><br />
<p align="left">&nbsp; &nbsp;现在&ldquo;科学家&rdquo;这个词常常被滥用了，其实只有能够发现自然、社会与人类<a href="#" target="_self"><u><strong>思维</strong></u></a>的既有规律的学者才应该称为&ldquo;科学家&rdquo;，而设计一座建筑，一种软件充其量只能称作工程专家。语言是思维的窗口，是自然的，也是社会的，透过语言我们触摸到人类思维的脉搏，而人类的思维是大自然最伟大的创造。有幸成为一名语言学研究者，有幸踏上一条通向科学家的道路，应该让人自豪与兴奋。比尔&middot;盖茨在他著名的《未来之路》一书中描述了他读到MIT史蒂芬&middot;平克教授的著作《语言本能》(TheLanguageInstinct)时的兴奋心情，平克是继乔姆斯基后的国际语言学大家，一本关于语言学的著作能够登上《纽约时报》畅销书榜首，能够获得&ldquo;软件国王&rdquo;的青睐，这说明语言学是充满了魅力的，关键在于你用怎样的视角，怎样的手法去研究它。</p>
<p align="left">&nbsp; &nbsp;计算机研究者和语言学研究者应该通力合作，语言学研究者不能认为计算机研究者只是<a href="#" target="_self"><u><strong>编程</strong></u></a>的工匠而笑话他们没有学术思想，计算机研究者也不能把语言学研究者视为加工语料库的帮手。计算机研究者要学习语言学，尤其学习那些描述语言普遍规律的可以形式化的语言学；语言学研究者也应该坐下来好好学学计算机理论，尤其是人工智能理论。计算机研究者期待着从语言学新的理论和模型中获得灵感，语言学研究者也可以从计算机研究者开发的语料库分析工具中获得研究上的极大便利。</p>
<p align="left">&nbsp; &nbsp;在通往语言理解的漫长道路上，我们发现身旁有一个与自己的装束、举止不同的行路人，你可能和他聊了几句，发现没有共同的话题，于是你们分别向前走。但是，在这座学术的密林里，他是你最近的伙伴，开始对话，开始了解对方，携手同行，携手披荆斩棘，&ldquo;计算&rdquo;和&ldquo;语言&rdquo;，一个都不能少。写到这里，我觉得有必要召开一次计算语言学领域，计算机学者和语言学专家的对话式论坛，一定很有意思。期待中。。。</p><br /><br />
<p align="left">[ 附录 ]</p><br />
<p align="left">网友1：一个语言学研究生</p><br />
<p align="left">我是一个语言学专业的研究生，现在也做一些中文信息处理的工作。刘老师提到当前语言学与计算语言学之间的鸿沟问题，我亦深有同感。这几年随着统计方法的风行，规则路线几乎完全被抛弃了。刘群老师在机器翻译领域里的<a href="#" target="_self"><u><strong>变化</strong></u></a>是一个最典型的例子，刘老师几年前拿着以规则为主的机器翻译系统参加评测几乎得到了倒数第一，后来改用统计的方法却可以排在前几名，这样的结果自然让人对规则在信息处理中的作用产生大大的怀疑了。去年参加中文信息处理25周年纪念会议时一个很明显的感觉就是几乎没有见到任何语言学研究者的身影（在临近结束时才看到陆俭明老师），这是让我深感遗憾的。我一直希望语言学能对中文信息处理有所贡献，可事实上两者却日益背道而驰。</p><br />
<p align="left">我常常为语言学在中文信息处理方面的无所作为而痛心，可惜人微言轻，连带着自己在系里也成了少数派。我常常想，语言学研究者在谈语言的用途时常常会提到语言教学和中文信息处理，可是到目前为止我还没有能够看到语言学的研究成果在这两个领域产生真正的影响。北大计算语言学研究所以词组本位理论为基础建立的语法信息词典和人民日报语料库，哈工大以依存语法理论为指导建立的句法树库是受到语言学影响的几个典型，据我所知有许多家研究机构已经购买了这些资源，但是对于它们对于实际应用的促进我仍然存在相当程度的怀疑。我一直试图在自己的研究中努力地为计算服务，可是努力了许久却感觉太难太难。在解决具体的问题比如自动分詞作詞性标注以及文本聚类时，总发现不知该如何应用语言学知识，尝试着写了一些规则效果反而变得更差。看来语言学知识的加入不是简单地加几条规则就能实现的了。</p><br />
<p align="left">网友2：</p>
<p align="left">最近看一些语言学专业研究生的论文时，我常常对他们所谓的面向中文信息处理提出质疑，我怀疑他们是否知道中文信息处理需要什么样的语言学知识。可是扪心自问，我自己知道这个问题的答案吗？好象也是模糊不清的。有时候我想对他们说，中文信息处理不需要这样的语言学知识，或者说它现在根本就不需要任何的语言学知识。好象有点自暴自弃了？但是事实的确如此，起码在我自己的工作中，除了一些基础的语法知识之外，我还真没有感到那些繁琐的语言学理论的价值。成千上万的语言学论文自称提出了无数条规则，可是哪一天中文信息处理系统才可能接收他们呢，可能永远都不会了。当年北大中文系詹卫东老师的博士论文被评为优秀博士论文，其中的八十九条规则被机器翻译专家认为每一条都无可挑剔。可是刘群老师以之为基础的机器翻译系统却彻底地失败了。这是一个令人痛苦的事实。语言学究竟能为中文信息处理做点什么？</p>]]></description>
		</item>
		    
		
		<item>
			<title>父亲节，端午节</title>
			<link>http://pssure.blog.sohu.com/51321448.html</link>
			<comments>http://pssure.blog.sohu.com/51321448.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Tue, 19 Jun 2007 15:07:02 +0800</pubDate>
			<category>杂记</category>
			<guid>http://pssure.blog.sohu.com/51321448.html</guid>
			<description><![CDATA[<p>&nbsp;&nbsp;&nbsp;刚过的那个周日是父亲节，我终于给爸爸打了个电话，告诉他节日快乐！</p>
<p>&nbsp;&nbsp; 其实以前过父亲节或是母亲节，都有想给爸爸妈妈打电话的想法，但一直就开不了口，总觉得当面说很别扭。而且这种非传统节日我们父母也并不知晓，就每次搪塞过去了。</p>
<p>&nbsp;&nbsp; 昨天因为端午节，我打电话回家问妈妈包粽子了吗，爸爸正好在旁边，还和妈妈说我给他打电话祝他父亲节快乐了，当时妈妈就说&ldquo;母亲节你怎么没给我打电话，只给我发了条短信！&rdquo;，听着是有点吃味，但却很温馨。母亲节那天我正好在外地，就没给妈妈打电话。是的，爸爸妈妈其实都在乎的，我即使是发了条短信，他们也还是一直都记着的。希望看到的朋友都记得，爱他（她），就告诉他（她）！</p>
<p>&nbsp;</p>
<p>&nbsp;&nbsp;今天是端午节，我难得一早就起来，本来是想去食堂喝碗稀饭，吃个咸鸭蛋，居然就没有了，枉费我起那么早（相对而言早，其实也七点半了！）。还好芳芳说买了粽子（蛋黄肉粽哦）让我去吃，哈哈！</p>
<p>&nbsp;</p>]]></description>
		</item>
		    
		
		<item>
			<title>轧神仙</title>
			<link>http://pssure.blog.sohu.com/47968009.html</link>
			<comments>http://pssure.blog.sohu.com/47968009.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Mon, 28 May 2007 22:50:19 +0800</pubDate>
			<category>杂记</category>
			<guid>http://pssure.blog.sohu.com/47968009.html</guid>
			<description><![CDATA[<p>&nbsp;&nbsp; 今年&ldquo;轧神仙&rdquo;活动从5月29号，一直延续到5月31号，共3天。南浩街、山塘街、石路步行街、老街坊四个区域都会有各具特色、形式丰富的活动：南浩街以草编、吹糖人等传统民间技艺表演为主；山塘街则是一场花鸟鱼虫的集会，来自农民原生态的戏曲表演也将第一次登上古戏台；步行街将组织起商圈商家，举办多元化的联展促销；在老街坊你则可以尝遍各地美食，当然还包括&ldquo;神仙&rdquo;食品。<br />&nbsp;&nbsp; 轧神仙是苏州的一个传统节日，据说每年农历四月十四这一天，在南浩街上会有神仙出现，如果我们有幸撞见，就会幸运一整年。不知道当初大家是怎么建立起这个说法的，反正以后每年就形成了这样一个固定的集会。届时，苏州制造的各种表演、各种小吃、各种花花草草都将一并拿出来交流分享，场面煞是热闹。 </p>
<p>四月十四日是八仙之一的吕纯阳的生日，他是民间信仰中很有影响的神仙。苏州阊门内中市下塘的福液观奉祀吕祖，俗称神仙庙，据说吕纯阳生日那天要化身乞丐、小贩，混在人群之中济世度人，因而逢此盛日每个人都可能是他的化身，轧到他身边，就会得到仙气，交上好运，这样你挤我挤的，叫作&ldquo;轧神仙&rdquo;。 </p>
<p>轧神仙原先只是民间宗教活动，后来变为一年一度的盛大庙会。届时，神仙庙附近小摊林立，各色小吃、工艺品、花鸟虫鱼，应有尽有。苏州市政府为保留这个民俗节日，修复了神仙庙，重建了南浩街。目前，南浩街已成为苏州传统风味小吃、特色食品、民间工艺品、日用小商品以及花鸟鱼虫、古玩绣品等&ldquo;苏&rdquo;味极浓的市井文化集萃地,承载了历代苏州的民间传说和历史故事的南浩十八景吸引了众多的中外游客,是苏州旅游的新热点。</p>
<p><a href="http://news3.xinhuanet.com/photo/2006-05/10/content_4530664.htm" target="_top"><img alt="" src="http://news3.xinhuanet.com/photo/2006-05/10/xinsrc_24205031016172343044836.jpg" border="0" /></a></p>]]></description>
		</item>
		    
		
		<item>
			<title>轧神仙</title>
			<link>http://pssure.blog.sohu.com/47967803.html</link>
			<comments>http://pssure.blog.sohu.com/47967803.html#comment</comments>
			<dc:creator>恋恋东风</dc:creator>
			<pubDate>Mon, 28 May 2007 22:48:55 +0800</pubDate>
			<category>杂记</category>
			<guid>http://pssure.blog.sohu.com/47967803.html</guid>
			<description><![CDATA[<p>&nbsp;&nbsp; 今年&ldquo;轧神仙&rdquo;活动从5月29号，一直延续到5月31号，共3天。南浩街、山塘街、石路步行街、老街坊四个区域都会有各具特色、形式丰富的活动：南浩街以草编、吹糖人等传统民间技艺表演为主；山塘街则是一场花鸟鱼虫的集会，来自农民原生态的戏曲表演也将第一次登上古戏台；步行街将组织起商圈商家，举办多元化的联展促销；在老街坊你则可以尝遍各地美食，当然还包括&ldquo;神仙&rdquo;食品。<br />&nbsp;&nbsp; 轧神仙是苏州的一个传统节日，据说每年农历四月十四这一天，在南浩街上会有神仙出现，如果我们有幸撞见，就会幸运一整年。不知道当初大家是怎么建立起这个说法的，反正以后每年就形成了这样一个固定的集会。届时，苏州制造的各种表演、各种小吃、各种花花草草都将一并拿出来交流分享，场面煞是热闹。 </p>
<p>四月十四日是八仙之一的吕纯阳的生日，他是民间信仰中很有影响的神仙。苏州阊门内中市下塘的福液观奉祀吕祖，俗称神仙庙，据说吕纯阳生日那天要化身乞丐、小贩，混在人群之中济世度人，因而逢此盛日每个人都可能是他的化身，轧到他身边，就会得到仙气，交上好运，这样你挤我挤的，叫作&ldquo;轧神仙&rdquo;。 </p>
<p>轧神仙原先只是民间宗教活动，后来变为一年一度的盛大庙会。届时，神仙庙附近小摊林立，各色小吃、工艺品、花鸟虫鱼，应有尽有。苏州市政府为保留这个民俗节日，修复了神仙庙，重建了南浩街。目前，南浩街已成为苏州传统风味小吃、特色食品、民间工艺品、日用小商品以及花鸟鱼虫、古玩绣品等&ldquo;苏&rdquo;味极浓的市井文化集萃地,承载了历代苏州的民间传说和历史故事的南浩十八景吸引了众多的中外游客,是苏州旅游的新热点。</p>
<p><a href="http://news3.xinhuanet.com/photo/2006-05/10/content_4530664.htm" target="_top"><img alt="" src="http://news3.xinhuanet.com/photo/2006-05/10/xinsrc_24205031016172343044836.jpg" border="0" /></a></p>]]></description>
		</item>
		    
		
	</channel>
</rss>
