订阅
纠错
加入自媒体

忌惮百度AI技术?美国要让其退市!AI领域,百度科研板凳有厚度!

07词汇联想功能

对特定词语,进行词语的联想。

比如对于“阴森”,能联想到“走廊”,“森林”,“古堡”等名词。

对于“太阳”,推荐“圆盘,金锣,火炉,火球“等可以用来比喻的词汇,用户可以借助此功能来激发写作灵感,或者据此写一些比喻句。本功能在写比喻句的时候尤其有帮助。

技术实现上,可以预先从大规模数据中自动挖掘出联想词表,联想词表中记录词与联想的词之间的对应关系,因此,根据联想词典可以确定出一个给定词语对应的联想词汇。

具体挖掘联想词表时,可以根据预设模板(如规定预设句式,如“就像…”)从名家名篇语料库中挖掘出形容词到名词以及名词到名词的联想词表,也可以通过词语搭配(可以限定词性)统计从大规模数据中自动挖掘获得。

进一步的,在抽出联想词表的同时也可以抽取模板,再通过新的模板挖掘新的联想词,不断迭代。

08灵感激发功能

在用户写作原文后,用人工智能相关技术在名家名作中精准地找到可供用户参考的句子或段落,从而激发用户灵感,提供修改的参考样例,同时让用户通过学习名作来加强写作水平。

简单说,给写手提供名家名言名句抄袭对象!

你写的粗俗不堪,上不了台面,没关系,给你经典造句对着抄。

技术实现上,可以从预先建立的文章库中,选择与写作原文整体粒度匹配的切分文本单元中,作为候选文本;基于人工智能计算写作原文与每个候选文本的相似度,根据相似度选择预设个数的候选文本作为灵感激发信息。

具体的,首先建立一个高质量的名家名作文章的库,然后进行切分,切分分别按照句子,自然段落和多段落三个不同粒度进行切分,最后形成句子,自然段落,多段落三种切分文本单元。

其次,在用户输入写作原文后,以写作原文整体与文章库中的切分文本单元进行比较,得到粒度匹配的切分文本单元作为候选文本。粒度匹配是指长度最相近的切分文本单元。

例如,写作原文是句子时,则将文章库中的句子作为候选文本;或者,写作原文是段落时,将文章库中的段落作为候选文本;或者,写作原文是多段落时,将文章库中的多段落作为候选文本。

再次,计算写作原文与每个候选文本的相似度,根据相似度选择预设个数的候选文本作为灵感激发信息。

计算写作原本与候选文本的相似度时,可以根据应用效果采用已有或将来出现的计算相似度的方案中的一种或几种的融合。

其中一种计算相似度的方案是:抽取出用户输入的写作原文中的关键实体词(实体词如命名实体,具体如地名、人名等)(或关键词)以及主题词(抽象出的原文主题,如体育、娱乐等)。如果用户输入的是长文本(如字数大于或等于预设字数),则使用主题模型和关键实体词(或关键词)两个维度来计算候选文本与输入文本的相似度。如果用户输入的是短文本(如字数小于预设字数),则可以使用GRNN或者CNN深度学习网络加上关键实体词(或关键词)两个维度来计算候选文本与输入文本的相似度,最后根据相似度进行召回和排序,呈现给用户。

09智能素材推荐功能

深度分析和理解用户提供的写作原文,为用户推荐相关主题的写作素材(如新闻,历史故事),用户也可以自己选择想要的素材类型,比如新闻,历史故事等(在图片中没有体现)。此功能在议论文写作中非常实用。

技术实现上,基于人工智能抽取写作原文的主题词,并根据主题词从预先建立的素材库中,选择主题相近的素材作为候选素材;根据主题模型计算写作原文与每个候选素材的相似度,根据相似度选择预设个数的候选素材作为智能推荐信息。

具体的,首先从公开的网页数据中抓取优质的新闻,人文历史故事等候选素材,然后用摘要技术和文档标签技术分别对抓取的语料进行处理,生成相应摘要和文档标签。

抽取出用户输入文本中的主题词,然后与语料的标签进行比对,召回一批候选的相近主题的素材,然后再使用主题模型计算用户输入与摘要的相似度,对候选的素材进行排序,将相似较高的呈现的素材的摘要呈现给用户,用户可以进一步通过点击来查看素材原文。

可以通过搜集用户的点击信息,作为素材质量水平的参考,并加入召回和排序的规则中去,不断演进产品的效果。

10智能基础改写功能

具体的,在用户输入写作原文后,在保证语义不变的情况下自动替换词语,修改句子的样式,改变语句语序等。如果用户在某种情况下希望借鉴某一段文字,但不能原封不动地直接使用,就可以通过本功能进行自动地改写。

技术实现上,可以采用两种方案,其一是:基于人工智能,对写作原文执行如下项中的至少一项,得到写作辅助信息:词语替换、句子改写、语序调整。其二是:采用基于人工智能建立的LSTM模型,确定与写作原文对应的智能基础改写信息。

具体的,本功能可以有两种方案进行实现:第一种是将改写任务分解成词语替换,句子改写和语序调整三个部分。词语替换直接使用词语替换推荐功能的技术方案(存在多个推荐词语时选择最优的),句子改写和语序调整可以使用规则模板,用语言模型进行过滤,去除低概率的改写方案。

另外需要加入一定的随机性,让用户每次点击可以生成不一样的改写。第二种方案是使用LSTM(Long Short-Term Memory)深度神经网络通过学习人工标注的复述语料直接对句子进行序列到序列的生成。

11智能润色改写功能

具体的,在原有文章基础上进行修改润色,让文章更有文采,更具文学性和可读性。比如替换一些更“高级”的词汇,增加一些形容词和短句等。

技术实现上,基于人工智能对所述写作原文进行词语替换、句子改写以及增加短语或短句,得到智能润色改写信息。

具体的,本功能主要可以分解为三个部分:词语的替换,句子的改写,以及增加词语或短句。词语的替换沿用词语替换推荐功能的技术方案,使用最优的替换结果。句子的改写有两种方案,方案一是人工配置一些润色的规则,方案二是人工标注一些润色的训练语料,用RNN或者LSTM神经网络来进行学习。增加词或短句(比喻,描写等)可以通过一定的模板挖掘从大数据语料中挖掘出实体或者主题对应的描写词和描写短句,并同时记录下短句周围的关键词。

每次对输入文本的句子作解析,用CRF模型或者句法分析规则找出句子的核心主体词,然后根据周围关键词的匹配,添加合适的描写词或描写短句。

本实施例中,由于加入了人工智能,特别是自然语言理解技术,功能更丰富更强大,更加智能。用户可以直接输入自己的写作原文,利用多项功能对自己的文章进行改进。

       原文标题 : 忌惮百度AI技术?美国要让其退市!AI领域,百度科研板凳有厚度!

<上一页  1  2  3  4  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

人工智能 猎头职位 更多
扫码关注公众号
OFweek人工智能网
获取更多精彩内容
文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号