近期学习整理

极乐净土 2012-06-13

1.groupby...having...构建约束查询

2.vlan是第二层的技术

c语言不支持函数重载,C++支持函数重载

main函数执行完毕,还可以执行其它函数,方法是使用atexit注册

宏定义的展开按照括号中展开,不会按照算数方法一样自动添加括号,如#defineSQR(x)(x*x)

调用SQR(b+2)得到的是b+2*b+2而不是(b+2)*(b+2)

3.文本分类中SVM算法效率和准确度是最高的

简要程序流程设计

读入语料库,存储的方式

分词

选取特征词

计算TFIDF值

svm-scale

得到训练数据集

svm训练

svm预测

计算完chi得到特征词后,将每一篇文档读入内存,计算分词后计算TFIDF后,写入文件,为类号,单词号,TFIDF值。属于相同类的记录要隔开。