首页 行业资讯 宠物日常 宠物养护 宠物健康 宠物故事

国内外在自然语言处理领域的研究热点和难点有哪些?

发布网友

我来回答

3个回答

热心网友

自然语言处理主要研究如何使计算机能够理解、生成、检索自然语言(包括语音和文本),从而实现人与计算机之间用自然语言进行有效交流。早期的语言处理系统处于一个有限的“积木世界”,运用有限的词汇表会话可以较好地工作,但是当把这个系统拓展到充满模糊与不确定性的现实环境中时,就出现了很多问题,自然语处理有以下几个难点:词语实体边界界定,在自然语言中词与词之间通常是连贯的,而正确划分、界定不同的词语实体是正确理解语言的基础 。这个问题对于汉语尤其突出。界定字词边界通常使用的办法是取用能让给定的上下文最为通顺且在方法上无误的一种最佳组合。然后是词义消歧,词义消歧包括多义词消歧和指代消歧。多义词是自然语言中非常普遍的现象。指代消歧是指正确理解代词所代表的人或事物。例如,在复杂交谈环境中,“他”、“it"到底指代谁。词义消歧需要对文本上下文、交谈环境和背景信息等有正确的理解。再一个是方法的模糊性,自然语言方法常常会出现模棱两可的句子,即一个句子可能会解析出多棵语法树。最后语言行为与计划,一个句子常常不只是字面上的意思而人类往往更注意其潜在的含义。自然语言处理研究内容主要包括语音识别、语音合成、文本朗读、机器翻译等,尤其是语音合成,已经取得了一定成就,不过,也要知道,智能语音合成的发展,同时也促进了人工智能的进步! - 人工智能 多智时代。

热心网友

认为自然语言现在最大的热点以及难点就是embedding method (distributed representation) . 因为关于discrete representation,大家已经做了至少50年了,可以认为大体比较成熟了。(transcer, ccg, lambda-DCS, pcfg, crf, hmm, etc.)Embedding也曾经以一个helper的身份出现过(LSA),但还没有像这次一样以主角的身份登场。所以虽说embedding是热点,,但在很多问题上embedding+neural network的组合表现相当好,而且明显能感觉出来研究的还很不到位。我很喜欢White pillow的答案,但关注点不同吧,我更感兴趣底层的技术。在问题不变的情况下,现在底层技术正在向embedding转变。所有的问题,大家现在都在尝试用embedding解决,我认为这只是个开始,具体怎样就要看几年后领域的研究成果了。

热心网友

先看大方向,这个比较好统计。NLP研究的大方向可以参考NLP会议的领域进行划分。各方向的热度可以参考顶会各个领域的论文接收数。虽然这个方法可能不是很实时,但我认为长期(五年)看还是能反映研究热度的,毕竟如果一个领域热门,研究人员多、进展多、论文多,大会组织者就会相应的扩大论文的接收数。不过会不会论文多是因为灌水多?所以我说要看长期而且是看顶会,一个会议如果长期允许这么灌水其档次肯定会下跌,市场规律嘛,这年头办个好会议也不容易。个人也可以根据这些数据自行判断各个领域的热门情况与趋势。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com