首页 >> 收录期刊 >> 计算机应用研究 >> 正文
杂志中文名:计算机应用研究
杂志英文名:Application Research of Computers
主管单位:四川省科学技术厅
主办单位:四川省电子计算机应用研究中心
地址:成都市成科西路3号
邮编:610041
电话:028-85249567 ;
Email:srcca@sichuan.net.cn
ISSN:1001-3695
主编:刘营












Web文本特征选择算法的研究
引用本文:冯长远,普杰信.Web文本特征选择算法的研究[J].计算机应用研究,2005,22(7):36-38.
作者姓名:冯长远  普杰信
作者单位:河南科技大学,电子信息工程学院,河南,洛阳,471003
基金项目:国家教育部科研基金重点项目(200305);河南省自然科学基金资助项目(0311012600)
摘    要:以向量空间模型作为Web文本的表示方法,结合Web文本的结构特征对向量空间模型中的特征选择算法进行了分析并加以改进。在改进的算法中,体现出了特征词在Web文档结构中的位置信息;引入了信息论中熵的概念,用词的熵函数对权值进行调整,从而更加准确地选取有效的特征词。实验验证了改进算法的可行性和有效性。

关 键 词:文本表示  向量空间模型  特征选择  
文章编号:1001-3695(2005)07-0036-03
作者简介:冯长远(1980-),男,河南荥阳人,硕士研究生,主要研究方向为信息检索;;普杰信(1959-),男,河南洛阳人,教授,主要研究方向为人工智能、模式识别.

Research about Algorithm of Web Text Feather Selection
FENG Chang-yuan,PU Jie-xin.Research about Algorithm of Web Text Feather Selection[J].Application Research of Computers,2005,22(7):36-38.
Authors:FENG Chang-yuan  PU Jie-xin
Abstract:
Keywords:Text Represents  Vector Space Model  Feather Selection  Entropy
本文献已被 CNKI 维普 万方数据 等数据库收录!
    浏览原始摘要     下载PDF全文