资源预览内容
第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
亲,该文档总共3页全部预览完了,如果喜欢就下载吧!
资源描述
3.2-3.4:学习 crf+工具包使用对语料进行整理编写程序 biyesheji_3.2.2 将语料由原“写 /v 信 /n E|Patient *E|Result” 修改为“写 v 信 n Result”;3.6:根据程序 biyesheji_3.2.2 整理出训练语料 4000 余条,测试语料 1000 余条。比例为 1:4;3.7:在程序 biyesheji_3.2.2 基础上,对语料格式进行修改检索,确保使用 crf+工具包无故障。对训练语料进行训练,并生成模型;3.8:根据特征,重新整理模板,并训练出模型模板 model-3.8.1:0,00,10,20,3模板 model-3.8.2:0,00,10,20,30,0/%x0,10,2/%x0,3模板 model-3.8.3:0,00,10,20,30,0/%x0,10,2/%x0,30,0/%x0,2模板 model-3.8.4:0,00,10,20,30,0/%x0,10,2/%x0,30,0/%x0,20,1/%x0,3模板 model-3.8.5:-1,00,00,10,20,31,00,0/%x0,10,2/%x0,30,0/%x0,20,1/%x0,30,0/%-1,00,0/%1,0生成模型通过该四组模型对 1000 条测试语料进行测试根据生成测试结果,编写 biyesheji_ZhengQueLv_3.8.1 程序,对测试结果进行统计算出错误率。模板 1 正确率为: 0.58016 模板 2 正确率为: 0.582164模板 3 正确率为: 0.58016模板 4 正确率为: 0.583116模板 5 正确率为: 0.5781562011 年 3 月 10 日星期四进行最大熵试验,先就动宾关系分类体系现有分类进行编号处理处理语料使用“基于条件随机场无上下文动宾关系标注”试验使用的训练语料及测试语料。编写程序 ME_test_LeiXingBianHao_3.10.1 对语料格式进行处理,将原来语料格式“写 v 信 n Result”改为 “03 写 v 信 n Result”。在处理过程中遇到的格式问题,使用程序 test_GeShiJiance.3.10.2 进行修改。修改好的训练语料为 ME_train.txt , 测试语料为 ME_test.txt投入 maxent 工具包进行训练,结束后对测试语料进行测试,正确率为: 0.565962试验结论:在计算机自动标注动宾关系的准确率上,使用 crf 模型总体程度上略优于最大熵模型。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号