当前位置:100论文网>>计算机网络论文>>面向因特网的模具知识本体描述方法探究

面向因特网的模具知识本体描述方法探究

发布:2010年7月27日 浏览:

摘要:通过对Internet上的模具知识特点的分析,提出了一种基于模具本体的语义标注方法,来对Internet上的模具知识进行描述,并结合具体的实例对该方法进行了说明。该方法使用基于模具本体的空间向量模型方法,将从页面中提取的特征词,用领域本体进行理解、扩充,然后基于相关算法,求出扩充后每个特征词的权值。通过这种方法对网页文档进行语义标注后,可以把文档隐含语义信息显式的表现出来,为模具知识搜索引擎的设计提供了基础。
关键词:模具本体;语义标注;空间向量模型;权值
随着网络的飞速发展和信息的迅速膨胀,人们越来越依靠搜索引擎来查找自己需要的信息。然而,通用的搜索引擎并不像人们想象的那样完美,一方面,通用的搜索引擎只是提供简单的关键字匹配,缺乏知识处理能力和理解能力,不能理解用户的真正查询意图,从而也影响其查准、查全率;另一方面,利用通用搜索引擎查找某一学科的专业信息也越来越困难,返回的信息过多,与主题不相关等,成为突出的问题。
本体具有良好的概念层次结构并且支持逻辑推理,能够对用户的检索请求进行理解、扩展。于是,基于本体的、针对某一领域的专门的搜索引擎成为研究的热点。
模具行业是一个经验性知识密集的行业,对于模具企业的从业人员、模具的研究人员及部分在校的师生而言,越来越习惯于使用网络查找想要的模具知识。针对通用搜索引擎的不足并满足模具行业相关人员对模具知识的迫切需求,构建基于本体模具知识的专业搜索引擎是有必要的。而面向Internet的模具知识本体描述方法的研究成为解决这一问题的基础。
模具本体的构建
本体(Ontology)的概念最初起源于哲学领域,研究客观事物存在的本质。随后,人们把本体的概念和方法应用于计算机领域,用于知识表示、知识共享和知识重用[1]。
人们对于本体的定义有很多种,较常为人们接受的是——本体是对共享概念模型明确的形式化规范说明[2]。本体在计算机领域内的应用主要是描述特定领域知识包含的内容和属性。基于本体建立的知识模型中应该包含类概念/类(concept/class)、属性(attribute)、关系(relations)、实例(instance)等基本要素。
目前,建立一个等级体系有三种方法:①自顶向下法:由某一领域的最大的概念开始,逐渐细化。例如:模具可以分为,冲压模具、锻造模具、铸造模具、粉末冶金模具等等,但铸造模具又可分为:砂型铸造、金属铸造、陶瓷型铸造、壳型铸造、实型铸造等等。②自底向下法:由最底层、最细小的类开始,然后将这些细化的类组织在更加综合的概念之下。③综合法:首先定义很多非常显而易见的概念,然后分别将它们恰当地归纳和细化。本文将采用自顶向下的方法,从顶级概念开始,对网络上庞大的知识进行归类,建立基础类,为以后概念获取后建立本体奠定基础。
Internet上模具知识的特点
根据实际的调查发现,模具知识在一些网页中也有少量的出现,但大部分都集中在少数模具论坛中,主要集中在以下八个针对模具的论坛中:中国模具论坛、中国模具CAD论坛、中国模具设计论坛、中华模具论坛、中国塑料论坛、华南模具论坛、昆山模具论坛、ProE模具论坛等。
统计方法为对各模块知识分类相同的模块除以总的论坛模块。因为不可能对论坛的每个知识点进行统计,所以该方法只是默认两个相同的模块每个知识点都是相同的情况下统计的,通过上表可以发现,两个相异论坛的的重复率大部分都在30%以下,而实际上,相异论坛的相同模块中的知识点并非完全相同;此外,考虑到各个论坛设置不同,同时也观察了相异论坛的相异板块,而结果是相异论坛的相异模块的重复率更低。综合考虑,我们基本上可以得出以上各论坛的知识的重复率就相当低的结论。
此外,上述各论坛虽然已有自己的站内搜索引擎,而这种搜索引擎的不足有两点:一是各论坛搜索引擎面向网站内部,不利于知识的共享;二是大部分搜索引擎利用的是关键字匹配的技术,缺乏知识的语义理解能力,影响了结果的展示。
 

相关信息

Copyright@2003 100论文网 备案号:鄂ICP备03014323号
100论文网提供的免费论文,请勿直接发表;如有侵犯您的版权,请联系我们,本站会立即删除!

Copyright © 2003 100论文网 All Rights Reserved. Powered by 建筑论文 Theme By 建筑论文网