极乐净土 2012-06-13
1.groupby...having...构建约束查询
2.vlan是第二层的技术
c语言不支持函数重载,C++支持函数重载
main函数执行完毕,还可以执行其它函数,方法是使用atexit注册
宏定义的展开按照括号中展开,不会按照算数方法一样自动添加括号,如#defineSQR(x)(x*x)
调用SQR(b+2)得到的是b+2*b+2而不是(b+2)*(b+2)
3.文本分类中SVM算法效率和准确度是最高的
简要程序流程设计
读入语料库,存储的方式
分词
选取特征词
计算TFIDF值
svm-scale
得到训练数据集
svm训练
svm预测
计算完chi得到特征词后,将每一篇文档读入内存,计算分词后计算TFIDF后,写入文件,为类号,单词号,TFIDF值。属于相同类的记录要隔开。