汉语词性分析

最近一直利用晚上时间在研究分词,不过中文分词实在是个麻烦的技术,个人能力也十分有限,特别对于底层技术还有很多缺憾,目前只能利用已有的字典文件进行分词,没有神经智能可言:(不过应付一些提取关键词以及查找分类什么的还稍微有点用途,有点不太好的就是效率不是很高,还得继续钻研啊……

在网络找到一个词典,很不错,词频、词重以及词性都有了,不过词性有的看不明白,通过网络整理到了一个比较全的北大的标注标准:

更多 »

MySQL报错“Got a packet bigger than ‘max_allowed_packet’ bytes”

在导入MySQL数据的时候发现会出现这样的报错信息。

“Got a packet bigger than ‘max_allowed_packet’ bytes”

看手册了解到这个应该是当前导入的数据大于系统的限制的最大包大小。

也许插入的数据太大了,不过因为当前做的项目不可避免会遇到这个大数据插入的情况,因此只能更改MySQL的默认配置。

暂时加大到10M,即在MySQL配置文件中加入一个参数(如果已经存在这个参数那么就修改):

max_allowed_packet=10485760

我这里写的单位是字节,换算过来就是10M,当然为了直观也可以直接等于10M

希望这个数值应该够用了,呵呵。

Microsoft Expression Web 2 简体中文体验

微软可能计划利用Microsoft Expression Web 2替代FrontPage(这里怀念一下FrontPage最初的HTML基础绝大多数还是来自FrontPage代码模式中的),刚刚下载到Microsoft Expression Web 2的30天试用版,将全部安装与体验过程截图。值得一提的是,Microsoft Expression Web 2支持PHP代码的开发,虽然不如专业的IDE那么强大,不过对于函数的代码提示还是比较清晰速度也比较快。美中不足的是这个软件继承了微软那庞大的身躯,安装文件达到500M多,安装后占用磁盘空间能达到接近800M多。

下载地址:http://www.microsoft.com/downloads/details.aspx?displaylang=zh-cn&FamilyID=28ca49cc-5f30-4b1f-a569-e7fdc83cef4f

申请Key的地址:http://www.microsoft.com/expression/productkey.aspx

更多 »

利用数组排序

前一阵写个小代码,因为涉及到的数据库数据不是很多,我将全部数据都写入到一个缓存数组中,这样进行列表的时候不会再次进行数据库查询(虽然数据不多,但由于整个系统的数据库压力很大负载比较高因此能不去查询数据库就尽量不去查询)。

array_multisort — 对多个数组或多维数组进行排序
说明
bool array_multisort ( array ar1 [, mixed arg [, mixed ... [, array ...]]] )

如果成功则返回 TRUE,失败则返回 FALSE。

array_multisort() 可以用来一次对多个数组进行排序,或者根据某一维或多维对多维数组进行排序。

关联(string)键名保持不变,但数字键名会被重新索引。

输入数组被当成一个表的列并以行来排序――这类似于 SQL 的 ORDER BY 子句的功能。第一个数组是要排序的主要数组。数组中的行(值)比较为相同的话就按照下一个输入数组中相应值的大小来排序,依此类推。

本函数的参数结构有些不同寻常,但是非常灵活。第一个参数必须是一个数组。接下来的每个参数可以是数组或者是下面列出的排序标志。

排序顺序标志:

SORT_ASC – 按照上升顺序排序

SORT_DESC – 按照下降顺序排序

排序类型标志:

SORT_REGULAR – 将项目按照通常方法比较

SORT_NUMERIC – 将项目按照数值比较

SORT_STRING – 将项目按照字符串比较

每个数组之后不能指定两个同类的排序标志。每个数组后指定的排序标志仅对该数组有效 – 在此之前为默认值 SORT_ASC 和 SORT_REGULAR。

不过,由于需要对数组进行各种方式排序,所以开始的时候觉得有点麻烦,想到常用的一个函数sort()可以简单的进行排序根据php函数的命名规则我想会不会有多数组的呢?哈哈,于是查询了一下array_multi_sort没有?再试array_multisort,哈哈,果然存在一个array_multisort(),详细看了一下说明就是我需要的函数。

另外为了加强记忆和理解在搜索引擎上搜索了一下,才发现学无止境啊,这个函数其实应该算做经常性和须灵活使用的函数之列。想起以前做的一个小项目,也涉及到数组排序问题,记得当时没考虑内置函数,自己写了一个函数那个复杂程序实在是头痛,现在想来真的是浪费时间:(

DBCheck build 20080425发布!

之前给客户做的一个小工具,自Discuz!3.1.2以来一直有人使用,因此一直不断得随着Discuz!更新而更新。

本次Discuz!升级到了6.1.0,因此,DBCheck的数据基准校验包(db_pack.php)也随之升级了。

功能上没时间做新的扩展——而且目前觉得也没太大必要,呵呵,这个工具几乎就是一次性的,大家都是为了查看自己的数据结构是否有问题,检查完之后也就不用了^_^

下载地址还是在“深海(Deepseath)Discuz!风格演示论坛”:http://www.exinqing.net/discuz/viewthread.php?tid=172

至于模板MSNCool过几天再弄,近期事情实在太多了,手里的项目还在继续赶:(

忙过这阵好好弄一下:)

Windows XP SP3尝鲜安装!

昨天下载了Windows XP SP3的RTM版。

今天晚上就迫不及待的在虚拟机上尝试安装了,安装没发现什么问题,安装完后也没发现太多能马上让人感觉一亮的东西,呵呵,可能原本这就是一些补丁集合包以及一些隐性的功能修正吧。反正我也没太用,除了补丁比较全(我在全新的SP2基础安装sp3,安装完毕后利用360度安全卫士扫描不出系统的补丁漏洞)外,其他倒没发现什么。至于老外说的“性能提升10%左右”也真的没太多感觉,哈哈。

上个截图,另有一个BT种子可以下载:http://bbs.exinqing.net/viewthread.php?tid=33180

07.png           08.png

IE8发布了中文的活动页面

地址是:http://www.microsoft.com/windows/ie/ie8/welcome/zh-cn/default.html

中文版下载:http://www.microsoft.com/china/windows/products/winfamily/ie/ie8/getitnow.mspx

暂时还没有时间玩,忙过这阵好好玩玩,要顺应潮流嘛,虽然微软总是有垄断的味道,不过谁让我们找不到其他更完美的替代呢,因此逆来顺受吧,呵呵。

事实上度过愤青状态的现在的我,越发越佩服微软了,现在看到那些动不动就骂Windows是垃圾的人感觉真的有些可笑——有骂人的功夫你去提高自己,开发一个自己的操作系统呀?呵呵。

总的说来比较期待IE8,特别是那些更完美的支持W3c 的特性,相信前台表现不需要考虑浏览器的时代快到了^_^

中国传统色彩名录

以下内容是转载自网络。
更多 »

我看UCenter

  Discuz!开发了一个类似Facebook的程序“UCenter”,这两天无聊的时候进去玩了会。挺有意思的。

  转眼离开Discuz!已经两年了,看着它慢慢发展感觉很欣慰,毕竟是自己曾经战斗过的地方。当初离开其实是想自己走条路同时也想更轻松一些,我不是一个有很大理想和抱负的人,就希望有个安稳的生活,有不需要我去写程序就能稳定的生活——写程序太累了。

更多 »

在 XHTML-Strict 模式下实现新窗口打开外部链接

点击浏览

PHP删除非空目录

  PHP内置的函数有一个rmdir()是用来删除目录的。但是这个函数根据手册:

尝试删除 dirname 所指定的目录。 该目录必须是空的,而且要有相应的权限。如果成功则返回 TRUE,失败则返回 FALSE

  因此可以自己写的函数来弥补rmdir的不足,思路很简单:先检查目录下有没有文件或文件夹,如果有,就用递归删除目录下的所有文件和文件夹,然后删除此目录。

  代码如下:<?php
function d_rmdir($dirname) {
if(!is_dir($dirname)) {
return false;
}
$handle = @opendir($dirname);
while(($file = @readdir($handle)) !== false){
if($file != '.' && $file != '..'){
$dir = $dirname . '/' . $file;
is_dir($dir) ? d_rmdir($dir) : @unlink($dir);
}
}
closedir($handle);
return rmdir($dirname) ;
}
?>

PHP中二维数组的排序方法

  非原创,转载来的,感觉还不错,备用^_^

更多 »

Deepseath Modified from Green Hope Theme · Proudly powered by WordPress · 津ICP备09005418号-1  津公网安备 12010302001005号