免费发布信息
 
当前位置: 首页 » 商务服务 » 企业服务 » NLPIR大数据语义智能分析平台的文本提取功能介绍
点击图片查看原图

NLPIR大数据语义智能分析平台的文本提取功能介绍

  • 发布日期:2019-09-28 00:05
  • 有效期至:长期有效
  • 商务服务区域:北京
  • 浏览次数51
  • 留言咨询
 
详细说明

文本信息是有具体的单元结构组成,包括句子,段落,篇章。文本信息抽取是指对现有文本数据进行信息抽取的过程,抽取单位也有具体单位组成。比如抽取文本数据中的短语,人名,或者地名。

 

从机器学习的角度分析,将文本信息抽取作为监督学习的一项具体运用。文本信息抽取可以分为两个阶段:学习阶段和抽取阶段。

 

NLPIR大数据语义智能分析平台在文本信息提取介绍方面,能够实现新词提取和关键词提取。

 

新词发现能从文本中挖掘出具有内涵的新词、新概念,用户可以用于专业词典的编撰,还可以进一步编辑标注,导入分词词典可提高分词系统的准确度,并适应新的语言变化。新词提取内容包括:词语、词性、权重和词频统计。本步骤所得到的新词, 可以作为分词标注器的用户词典导入,从而使分词结果更加准确。

 

关键词提取能够对单篇文章或文章集合,提取出若干个代表文章中心思想的 词汇或短语,可用于精化阅读、语义查询和快速匹配等。关键词提取能够对单篇文章或文章集合,提取出若干个代表文章中心思想的 词汇或短语,可用于精化阅读、语义查询和快速匹配等。关键词分析内容包括: 词语、词性、权重和词频统计。系统默认词汇以权重值高低排序。

 

同时,NLPIR大数据语义智能分析平台能够实现对于新词、关键词提取结果的高维可视化展示,可视化形式有三种:文 本格式、二维格式与三维格式。用户可根据需要直接使用,无须再次设计美化。 

 
[ 商务服务搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

0条 [查看全部]  相关评论

 
联系方式