首页 公司简介 新闻中心 产品纵览 成功案例 解决方案 客户服务 招贤纳士 友情链接
 
     首页-解决方案-信息智能-正文
方正智思智能分析系统

     业界正不断尝试各种技术方法,力求使得计算机能够帮助利用和处理这些海量信息,例如:关键字搜索、信息标注、交叉过滤和语言方法等等。通过这些方法提高了计算机对非结构化信息的处理能力,但这些方法都需要大量的人工干预,其自动化处理能力和实时处理能力都不够强大。人们希望计算机能够快速地智能地分析处理各类信息。

方正智思是一个中文智能信息挖掘与知识管理平台软件。它是以方正多年积累的中文信息处理技术和中文自然语言处理技术为基础,融合了最新的人工智能、信息检索、文本挖掘的研究成果。它提供对海量文本进行智能检索、智能分析及智能化自动处理的功能。用以帮助用户解决海量信息的智能分析处理,推动政府、媒体和企业信息化进程。

一、          技术总体介绍

方正智思是以自然语言处理技术与数据挖掘技术为核心,融合了中文信息处理、图形图像处理、人工智能、信息检索的最新研究成果,主要包括以下关键技术:

 

一二、         关键技术介绍;

1.   网络雷达信息获取

n         对信息源全面监控,任何新信息的更新会被立刻抓取捕获下来

n         可定时定点的监控目标网站,抓取目的网站资源

n         支持对图片内容的抓取

n         支持对网页页面的局部栏目信息块的抓取

n         可视化的待抓取内容定制与属性提取配置

n         高效的并行分析与抓取算法

2.   自动摘要与自动关键词提取

自动摘要是通过智能的手段为文档自动形成摘要的技术。

自动关键词提取是通过智能的手段为文档自动提取关键词的技术。

3.   自动分类

自动分类包括基于学习的自动分类和基于规则的自动分类。

在实际应用系统中,在该引擎核心上可实现对文本网页、新闻图书、图片的自动分类,大大减少手工劳动的工作量,提高处理的准确性。

4.   自动聚类

方正智思的自动聚类引擎采用文档向量空间模型,将K-means聚类算法与后缀树算法相结合。针对文档与媒体数据的海量高维特性以及孤立点特性,引擎算法中融合了我们最新的研究成果,在处理海量文档及媒体数据时具有优异的品质。

实际应用系统中,在该引擎核心上可实现对各种检索后获得的大结果集实现自动聚类并构建树状结构,以便使用者快速定位所需信息;对新闻稿件的自动聚类,辅助专题制作等。

5.   主题检测/追踪

主题检测任务是自动在线检测内容不断更新的数据源中的新主题。主题追踪是指在信息来源中追踪那些与讨论目标主题相关的信息片段(如单个文档,新闻报道等等)。这一技术是国际学术领域正在研究的最新课题之一。

方正智思的主题检测/追踪引擎采用了最新的国际研究成果,引入新的特征抽取与时间窗算法,结合我们在中文信息处理方面的优势而实现的引擎核心,它对中英文文章均具有很好实用性能。

实际应用系统中,在该引擎核心上可实现对互联网热点事件的快速识别与追踪、辅助进行专题报道、关联资料整理等。

6.   相关推荐与消重

自动文本消重是利用文档的内在特征信息进行智能分析,判断文档的相似性与重复性。

实际应用系统中,在该引擎核心上一方面可实现对文本的自动消重,降低文章冗余度,避免文章重复发布等,另一方面可实现自动查找相似文本并向检索者推荐的功能。

7.   关联分析与趋势分析

关联分析是从海量数据中挖掘信息之间的关联关系。

趋势分析是实现与时间相关的分析,分析事件过去发展方式并为预测其今后的发展趋势提供参考。

 
 
  >> 网站地图 >> 联系我们 >> 招聘专区 >> 法律声明  
  京 ICP 证 010036 号