您的位置  > 互联网

(干货)计算语言学中有五个任务

要弄清楚这五个任务中哪一个是重要的,我们必须首先弄清楚每个任务的基本含义。 按照我的理解,第一个任务是语言学问题,从语言学的角度来看计算语言处理。 任何学科都有需要解决的问题,自然语言处理需要解决语言学问题,比如句子切分问题。 不同的分句方法有不同的句子含义。 它是整个加工过程的开始。 至于第二个任务(语言的形式化),我们需要使用数学工具将语言问题表达为语言模型。 这个时候,就需要我们现阶段将语言学中的研究问题形式化,严格并有规律地表达出来,比如句法切分模型M(F,W,T,K)s; 而语言模型需要通过计算机算法描述成可计算的模型,这是第三个任务,在这个任务中,可以实现计算形式化,比如前向或后向最大匹配算法、动态规划算法等。完成后完成以上任务后,我们就可以开始编程了。 这是第四个任务,使用编程语言来实现这个计算模型。 最后的第五个任务是我们需要通过计算一些指标来评估结果,比如准确率和召回率,来评价任务的完成情况。

正如我在初稿中所说,我觉得最重要的应该是使命。 因为我认为在整个计算语言处理过程中,最核心、最困难的应该是如何利用计算机来处理自然语言问题。 如果你不能完成任务,你将无法使用计算机这个强大的工具来处理自然语言。 学习问题。

算法描述的问题是可以被计算机计算的,但对于一些不可计算的问题,比如一个洗澡的人给一个不给自己洗澡的人洗澡,那么理发师是否给自己洗澡就是一个悖论。 理论是不可计算的,无法用计算机来解决。 自然语言是为特定目的而创建的语言。 它是人类交流的工具。 纯自然语言模型是不可计算的,无法用计算机进行计算和处理。 自然语言是人工智能最难解决的问题。 一。

那么哪个任务是最重要的呢? 我认为,根据衡量标准,答案会有所不同。 从以上五项任务的描述中,我们可以清楚地看到,它们和任何科学研究一样,是一个始终紧密相连的过程,是一个不可分割的整体。 因此,它们的不可或缺性被用作衡量标准。 同样重要; 如果以实施难度为标准,第二项和第三项任务更为重要; 如果以工作量为标准,第三项和第四项任务更重要,那么我将在下面提供我的想法之一。

作为一名研究者,应该更加注重基础理论的研究。 这不仅仅是为了产生学术成果,更重要的是基础理论是学术研究的基石,是研究成败的关键。 因此,我想我是否有更强的理论基础作为衡量标准,语言的形式化为解决语言问题提供了数学模型。 该模型是整个系统的基础,涉及语言学、数学等学科的理论。 计算的形式化为实现模型提供了各个方面。 一种高效的算法,涉及数学、计算机科学等学科的相关理论。 另外,模型的建立在一定程度上决定了可以选择的算法。 算法的好坏反过来又验证了模型的正确性和有效性。 两者是最密不可分的。 研究人员应该同时考虑两者。 从方面来看,我们甚至可以将这两个任务统一为一个任务,所以我认为第二个任务和第三个任务非常重要。 它们都是自然语言处理中非常重要的任务,但是哪个任务最重要呢? 从下往上分析。

事实上,如何将语言模型变成可计算模型非常重要,也是利用计算机处理语言问题的关键。 语言模型能否实现是判断能否用计算机来处理该模型的标准。 建立可计算模型后,编程就非常简单了。 当然,评估阶段也很重要。 该任务可以评估解决实际问题的能力,然后比较不同的模型并选择最佳模型。 但这就是说,这些任务虽然重要,但却只能稍后再进行。

对于从语言学角度处理自然语言处理的问题,任务就是将问题转化为语言模型,对问题进行标准化和建模。 这也是一个比较重要的任务,但是属于语言学的范畴。 计算语言学的关键是用计算机来处理语言问题,所以我认为是最关键的。