最近一直利用晚上时间在研究分词,不过中文分词实在是个麻烦的技术,个人能力也十分有限,特别对于底层技术还有很多缺憾,目前只能利用已有的字典文件进行分词,没有神经智能可言:(不过应付一些提取关键词以及查找分类什么的还稍微有点用途,有点不太好的就是效率不是很高,还得继续钻研啊……
在网络找到一个词典,很不错,词频、词重以及词性都有了,不过词性有的看不明白,通过网络整理到了一个比较全的北大的标注标准:
更多 »
08年 BLOG CSS Deepseath Function HTTP IE ip Javascript jQuery mp3 MySQL PHP Server ThinkPad W3C Web Windows WinXP 世界杯 中文 人生 代码 分享 北京 升级 国足 天津 开发 技术 收音机 朋友 服务 服务器 泰达 浏览器 照片 电影 祝福 网络 补丁 观后感 足球 转载 音乐
WP Cumulus Flash tag cloud by Roy Tanck requires Flash Player 9 or better.
Deepseath Modified from Green Hope Theme · Proudly powered by WordPress · 津ICP备09005418号-1 津公网安备 12010302001005号