AXZ博客
给你海洋的知识 AXZLK.COM!

易语言怎么写语音识别(语音信号处理与识别)

语音信号处理与识别_易语言怎么写语音识别_变声语音怎么识别

今天国人妈妈给大家分享的是华东师范大学心理与认知科学学院蔡青教授的演讲。 推荐此演示文稿,因为:

1、演讲中列举了大量的科学研究,详细描述了儿童语言学习的过程。 提到的一些科学结论对家庭教育也有很大的参考价值。 例如:

2、文章还指出,在谈关键期的时候,我们往往会关心时间在之前,但其实我们也需要关注应该在什么时候之后,这样才能适应孩子的能力发展。

总之,这篇文章对“语言关键期”的解读科学透彻,非常值得一读。

|

本文转自易喜,ID:yixiclub,已授权

大家好,我是蔡青。 你刚才看到的那个博学的非人灵长类动物朋友是倭黑猩猩。 它是我们在进化树上最近的邻居。

变声语音怎么识别_易语言怎么写语音识别_语音信号处理与识别

和大家一样,我也被它的词汇量惊呆了。 作为一个四岁孩子的妈妈,我想知道是因为它认识的字多还是我儿子认识的字多。

易语言怎么写语音识别_语音信号处理与识别_变声语音怎么识别

幸运的是,研究告诉我们,一个四岁的孩子大概能认出2000到4000个单词,并且存在个体差异,但与这只倭黑猩猩大致相同。 那么,这是否意味着他们具有相似的语言能力呢? 当我第一次想到这个问题时,我的脑海里浮现出我侄子四岁时说过的一句话。

那时,他和其他孩子一样,不愿意上幼儿园。 他和妈妈这样表达:“在幼儿园,孤独就像一张网,把我网住了。”

倭黑猩猩不会“说”话。 即使它们能发出声音,我相信也表达不出这样一句意味深长、句法如此完整的句子。

语音信号处理与识别_易语言怎么写语音识别_变声语音怎么识别

所以说一个字其实是很难的。 除了发音部分,我们还需要知道词汇的意思,了解句法结构,知道在什么情况下应该如何使用这些句子。

1、语言能力是人类独有的吗?

任何语言都需要两种基本能力。 首先是统计能力,不断统计通话过程中的语音信息。 另一种能力是掌握声音序列中的抽象规则并概括这些抽象规则的能力。

语音信号处理与识别_易语言怎么写语音识别_变声语音怎么识别

我们在做语言研究时经常提到的“模型动物”之一就是鸟类。

在 2012 年的一篇研究论文中,一只唱歌的鸟被教给了“叽叽喳喳”的声音序列,发现如果声音序列发生变化,鸟儿可以检测到它。 因此研究人员得出结论,鸟类可以学习顺序规则。

但是你可能会发现:不,任何一只鸟在它的“鸟类生活”中可能只需要记住十句话,所以只要它以前没有听过这句话,它就不需要真正去使用它。 规则。

这点被质疑后,大家争论了很久,直到灵长类研究回答了这个问题。 最近,我的一位同事王利平和他的研究小组做了这样的研究。

这是一只猕猴。 他们发现,这只小猴子不仅能学会演示序列,而且经过一年多的学习一万多次,还能学会一个非常复杂的东西:你只要给它一个序列,它就可以逆序点击出来。 也就是说,它不仅学习了这个序列,还对其进行了某种逆向的抽象计算。

易语言怎么写语音识别_语音信号处理与识别_变声语音怎么识别

鉴于这项研究,现在应该提出人类特异性的问题:人类语言在多大程度上是特异性的? 我们常说,人类个体的发展是整个系统发育发展的一个缩影。 今天,让我们来看看孩子,看看人类是如何从出生开始学习语言的。

2. 新生儿:惊人的统计学家

在胎儿期,大脑发育非常迅速。 到婴儿出生时,大脑的重量是成人大脑的1/4到1/3,约为300克。 可见,婴儿出生时的脑沟形状与成人非常相似。

变声语音怎么识别_易语言怎么写语音识别_语音信号处理与识别

我们都说宝宝一出生就是一张白纸,其实完全不是这样的。 我的一位同事甚至说了一句很斩钉截铁的话:每个婴儿出生的时候,就已经是贝叶斯统计机器了。

大脑成像研究发现,出生后不久,听到母亲和他说话的婴儿比听到不认识的女人说话时大脑左侧语言区的活动更多。 他不仅能认出“这是我妈妈”,还会努力去理解妈妈想对我说的话。

易语言怎么写语音识别_变声语音怎么识别_语音信号处理与识别

甚至比那更早。 说到婴儿早期,同事 Ghislaine Dehaene-Lambertz 对妊娠 30 周出生的早产儿进行了以下研究。

易语言怎么写语音识别_语音信号处理与识别_变声语音怎么识别

在妊娠 30 周时,大多数婴儿仍未出生。 这时候,他们的右半球已经可以察觉到是爸爸还是妈妈在跟我说话; 同时,他们已经可以分辨出“吧、哒”等不同的声音,左右脑都参与了音素的辨别。 这个活动。

3. 成为世界公民的第一年

一些研究人员是这样说的:儿童是世界公民的时间超过生命的第一年。 什么是全球公民? 例如,南京人可能很难区分“n”和“l”。 事实上,这种现象在所有语言中都存在。 母语为英语的人很难区分“qi”和“xi”。

但是对于婴儿来说就不是这样了。 宝宝六个月大的时候,只要两个音有区别,他们就能马上把这两个音分开,不管这个区别在他们的母语中是否出现。 那他们什么时候会失去这个能力呢? 大概一年后吧。

看看这个说中文的蹒跚学步的孩子,他可以继续很好地区分“气”和“习”,但是在十到十二个月的时候,美国出生的婴儿已经没有能力区分这两种能力了。

变声语音怎么识别_易语言怎么写语音识别_语音信号处理与识别

易语言怎么写语音识别_语音信号处理与识别_变声语音怎么识别

这期间到底发生了什么? Patricia Kuhl 的团队进行了一项研究。 他们将看看在这段时间让美国婴儿接触普通话是什么感觉。 他们找了一位经常给孩子讲中文的普通话女士,里面有“西瓜”、“气球”之类的“齐”、“喜”之类的词。

他们发现,在这段时间接触到“qi”和“xi”这两个发音的美国婴儿,和讲中文的婴儿一样,到一岁末就能够很好地区分这两种声音。

易语言怎么写语音识别_变声语音怎么识别_语音信号处理与识别

后来,研究人员想,可不可以偷懒,把给宝宝讲“气”、“喜”等活动录下来,每天给宝宝看。

令人惊讶的是,他们发现它似乎不起作用。 如果有真人与宝宝交流,可以增强语音识别的效果,但如果只使用录制的视频,则根本达不到这种效果。 因此得出结论,在早期发音学习的过程中,真实的社交互动起着非常重要的作用。

4. 婴儿如何学习他们的第一句话?

phonics学习后,孩子进入了一个新的阶段。 在六个月到九个月之间,发生了一件非常重要的事情,当时许多父母都不知道:婴儿开始理解他们生命中最初的几个词。

在他们一岁生日之前,婴儿无论使用什么语言,都已经可以理解大约 50 个单词。 我们可能认为词汇很容易理解,就是把声音和图像联系起来。 但科学家们发现,这还不是全部。

实验室研究发现,通过给四个月大的婴儿看某种形状并听到“kiki”,他可以了解到尖头形状与特定单词“kiki”相关,而“kiki”bubu“与这个圆形相关。 因此,婴儿早在四个月大时就可以将声音与形状联系起来。

易语言怎么写语音识别_变声语音怎么识别_语音信号处理与识别

为什么婴儿要花更多的时间来学习他们最早的词汇? 其实我们仔细想想就会发现一件事,那就是宝宝学习词汇的过程,并不是简单的通过音形连接来完成联想学习的过程。 它需要一个很重要的东西,就是我们所说的共同关注。 社交能力。

如果六个月前你指着什么对孩子说“看,杯子杯子”,他会一直盯着你看,根本不会跟着你的手转头看旁边的东西。 除非有东西放在他面前,否则他不会注意到。

共同注意的能力是指能够跟随他人的手势或眼神,了解对方的注意力在哪里,并跟随他的注意力过去的过程。 相反,他也明白,通过指向,他是在唤起其他人对那里的一个过程的注意。

这种能力要到六到九个月大时才会发展。 这种共同注意能力可能会限制儿童的词汇学习。

一旦获得了共同注意的能力,其实还有一个非常困难的步骤,就是他要把声音和一些具体或者抽象的意义联系起来。

仔细想想,这不是一个简单的连接。 当宝宝听到或想到“飞机”时,可能是他的玩具飞机,也可能是书本上画的飞机,也可能是天空中各种不同形状的飞机。 他需要知道这些东西是飞机,他需要抽象的能力。

变声语音怎么识别_语音信号处理与识别_易语言怎么写语音识别

想想“爸爸”“妈妈”这样的词,情况其实更复杂。 因为妈妈可以是自己的妈妈,也可以是别人的妈妈,也可以是妈妈的妈妈。 所以词汇学习绝非易事。

我们刚才说了,孩子在一岁左右的时候学会了人生中的前50个单词,然后才慢慢开始理解词组。 比如“dog”可以有“yellow dog”、“大黄狗追小狗”、“all dogs”。 我们讲起来,感觉很简单,但是对小孩子来说就不是这样了。 他需要能够将这些概念与概念联系起来。

而且当宝宝理解了“chasing the dog”的时候,他必须明白dog是被追逐的对象,他必须知道“chasing the dog”前面有一个主语,就是baby chasing the dog或者妈妈在追狗,所以在这个过程中他也会一路学习语法。 而一些像“一些狗”和“所有狗”这样的表达需要他的小脑袋做更多的逻辑计算。

5、语言的爆发期

语音信号处理与识别_易语言怎么写语音识别_变声语音怎么识别

到一岁多时,孩子们已经掌握了上述实际上很难的语言技能。 任何一门语言,大家都会注意到,在一两岁以后的某个阶段,孩子们突然就好像拥有了超能力,语言爆发期就开始了。

我的孩子也一样。 一岁半时,他很着急,一句话也说不出来。 在我一岁零七个月大的时候,我上了幼儿园。 第一周礼拜结束时,我变成了话痨,各种复杂的字眼没完没了地说了很久。

为什么会出现这种情况? 其实,在语言爆发之前,宝宝的小脑袋就已经做好了好几个准备。

首先,我们刚才说的,那个时候,他至少已经认识了一两百个以上的单词; 在听大人讲话的过程中,他已经知道了一些基本的单词和单词之间的区别。 而且,每天看着父母和他说话的时候,他也在学习如何使用自己的发音系统,通过自己的调整和大人的纠正,才能更准确地发出这些声音。

但还有什么比这更重要呢? 是社会需求。 他以前天天在家陪父母,觉得只要我一动脑袋,他们就知道我想要那个。 头一动就问宝宝要不要喝水? 宝贝,你想要一辆玩具车吗?

后来有一天上托儿所或者出去玩的时候,他觉得太奇怪了,脑袋动了半天。 别人不知道我想要什么,只能跟他们说说……所以,社交需求其实是语言爆发的一个非常直接的原因。

但是每个孩子的语言爆发期早晚会有很大的不同,可能是从一两岁到三四岁。 研究人员注意到的一件事是,生活在第二语言或多语言家庭中的孩子通常说话较晚。

你可能会说,没关系,我们家都是中国人。 但是你想想,比如在上海的一个家庭,可能妈妈对宝宝说上海话,爸爸对宝宝说普通话,爷爷奶奶对宝宝说方言。 从语音输入的角度来说,他也是通晓多种语言,准确的说,是通晓多种语言。

这个时候你需要什么? 他的小脑袋不停地数着,他做了好几个系统,放到了那个地方。 现在轮到妈妈,你要说上海话,就需要压制其他系统,只激活上海话系统。 一会儿看到爷爷,他就得切换到方言系统。

这个过程涉及到一个很重要的能力,就是认知控制。 这种能力通常要到一两岁才能得到很好的发展,所以如果是在双语家庭长大的孩子,他说话晚是有道理的,因为语言和认知对发展很重要。 一个相互制约的过程。 所以家长们不用担心。

并且一些研究发现,橙色部分是双语者在成年后比单语者具有更强的大脑网络连接。 这可能表明双语者从童年到成年和老年都有更好的认知控制和认知灵活性。

易语言怎么写语音识别_语音信号处理与识别_变声语音怎么识别

接下来,在一个英语社会,我们的团队对华语家庭做了一个调查,发现一个很有意思的事情,就是在这些说华语的家庭中,父母对孩子说英语的比例直接决定了孩子的英语水平和认知控制能力,但父母的英语水平对孩子成年后的英语水平没有影响。

很多家长想和孩子说英语的时候,都担心我的英语太差。 这项研究可能会告诉我们,大可不必担心,您可以放心地把自己不完美的英语说给您的孩子听。

6. 孩子的话

刚才讲的语言发展过程看似简单,但是我们都会注意到孩子在语言习得过程中会犯很多有趣的错误。

易语言怎么写语音识别_变声语音怎么识别_语音信号处理与识别

比如,宝宝很小的时候,就学会了一个词,“狗”。 然后他会指着一只猫,“小狗”。 大家笑说,连狗猫都分不清。

但是仔细想想,这个概念刚形成的时候并不容易。 孩子是怎么认识狗的? 所有毛茸茸的、四足的、奔跑的动物都是狗。

易语言怎么写语音识别_语音信号处理与识别_变声语音怎么识别

我的父母有时还会嘲笑我小时候的一些事情。 他们拿了东西,我想吃,就冲他们喊:给你吃,你吃。 后来他们的朋友过来说,你家孩子真好,小小年纪就知道孔融做梨子了。

变声语音怎么识别_语音信号处理与识别_易语言怎么写语音识别

事实上,根本不是这样。 这是因为我之前讲过。 想一想,要想知道是“为你”还是“为我”,首先要知道“我”就是我。 我怎么知道是我? 需要自知之明。

对于自我意识,最典型的研究就是镜子研究,你能知道镜子里的人就是你自己吗。 研究发现,婴儿直到大约十到十二个月大时才意识到镜子里的人是我。 除了人类之外,前面提到的灵长类动物、鸟类以及聪明的大象和海豚都可以发展这种能力。

人类直到一岁左右才知道这是我,然后他们意识到,哦,语言中的“我”是指镜子中的那个。 所以如果一个婴儿很早就开始说话,他的自我意识还没有发展到足以正确使用代词的程度。

父母常常担心孩子说话晚,但另一方面,说话晚的孩子在说话时已经发展了很多认知和社交能力,并且会少犯错误。

易语言怎么写语音识别_语音信号处理与识别_变声语音怎么识别

儿子小时候,经常“创造性”地用词。 当他爸爸生气时,他会说“你多大了”。 当孩子刚刚学习词汇时,他们会误用这些词汇。

语音信号处理与识别_易语言怎么写语音识别_变声语音怎么识别

两三岁刚过“可怕的两岁”,往往刚上幼儿园的时候,很多孩子都会遇到这样的事情:学会了很多脏话,特别爱骂脏话,回来说,“你这个白痴”“你这堆便便”。 家长很生气,说你怎么一上幼儿园就学不好,谁教你的,跟哪个孩子学的。

但是无论你怎么说他,孩子都会不停地对你重复这些话。 为什么会这样? 其实是因为他说了这句话之后,他的父母反应非常强烈,然后他才觉得“不不不”之后,他第一次感受到了语言的神奇力量。

孩子第一次发现的最神奇的词是“不”。 你跟他说什么,他说“不行不行”,发现他可以拒绝你。

然后他发现你说“笨”的时候还那么主动,所以这种情况下,家长当时可以不理他,不管他说什么,不理他,事后纠正他就好了。

7、为什么人工智能很难达到儿童的语言水平?

说完这些关于儿童语言发展的事情,你可能感兴趣的另一件事是,为什么人工智能“语音”从1970年代至今这么多年都难以达到儿童的语言水平?

从心理学和发展科学的角度来看,我们会注意到一个很有趣的观点:人类是通过多种感官来学习语言的,而不仅仅局限于语言本身。

当我站在这里说话的时候,大家会用视觉信息和听觉信息来整合我所说的话,然后用已有的经验和现状来尝试理解我的意图。 这些都是人工智能自然语言处理还做不到的事情。 目前人工智能的自然语言处理主要是通过不同的算法/解析器对大量文本进行大量训练。

在测试人工智能的语言交流能否达到与真人相同的时候,一个经典的方法就是图灵测试。 这是一个黑盒测试:在没有看到对方的情况下,测试者可以通过随机提问来判断对方是不是人。 虽然可能没有最合理的测试方法,但可以肯定的是,至少到目前为止,人工智能还没有能够真正理解语义本身。

近年来,一些人工智能研究者都注意到了这个问题。 去年,几篇关于人工智能的重要论文使用了一种新方法,让机器像孩子一样学习语言。

这些研究人员制作了一些小视频,比如一个人喝水的视频,副标题是“我渴了”。 他们同时做了一个视觉解析器和一个语义解析器,通过同时训练视觉信息和语言信息来实现多感官整合。

或许心理学、发展科学、神经科学的进步能给人工智能带来一些更好的启示,或许有一天机器人真的有办法与我们更好地交流。

8.阅读障碍

刚才我们讲的是“听、说、读、写”的听说部分。 阅读和写作部分实际上要到五岁才开始学习。

易语言怎么写语音识别_语音信号处理与识别_变声语音怎么识别

易语言怎么写语音识别_变声语音怎么识别_语音信号处理与识别

大家都知道这三个著名人物吗? 他们有一个共同点易语言怎么写语音识别,就是都有阅读障碍。 他们的一般认知没有问题,在某个领域都非常有天赋,但是他们看书的时候读得很慢,很容易漏读、读错或者读出相似的词。

研究人员发现,这可能是由语音编码、语音-视觉联系或视觉文字处理中的许多不同问题引起的。 有的家长可能会觉得,我的孩子才刚开始学读写,好像也有这个毛病。 让我们看看这项研究,让一个五岁和一个六岁的孩子在一个点旁边写下他们的名字。

变声语音怎么识别_语音信号处理与识别_易语言怎么写语音识别

Lissle 五岁,Meggie 六岁,当点右边有足够的空间时,他们都写得很好。 而当点的右边没有地方时,莱塞尔又自发地把名字倒过来写了下来。 梅吉六岁,她不会那样做。

为什么? 许多孩子刚开始学习阅读时都会遇到这种情况。 其实这跟人的视觉恒常性有关系。 所谓视觉恒常,就是当你看到某样东西,比如汽车,无论从哪个方向看,都会马上说这是一辆汽车。

这种能力不仅是人类所独有,大多数生物都具备,而且这样的能力对于生存来说是非常重要的。 当一只老虎向你跑来时,你不在乎它是左还是右。

这种阅读习得的能力,就是所谓的得失。 我们看b或者d的时候,如果把它看成一个物体,那就是同一个物体的翻转。 还有 p 和 q。 所以其实我们需要在阅读的过程中克服这些视觉恒常性,才能更好的学习阅读能力。

9.语言真的有关键期吗?

说到语言发展如此漫长的过程,我们经常会听到一个词叫“语言关键期”,它最早出现于1970年代,由Reineberg等人提出。

他在一些早期的动物研究的基础上,进一步将这些动物研究的结果应用到儿童身上,然后结合他们当时的一项发现:青春期后脑损伤的人不太可能恢复语言,并有某种失语症,并提出人的语言学习有一个关键期。

在座的各位可能都听过学校老师和教育机构反复说过“语言关键期”。 作为家长,有时候心里会很着急,生怕孩子错过了某个语言发展的关键期。

我觉得这几年语言的关键期被夸大了。 其实就是所谓的“语言关键期假说”。 所谓假设,并不是很确定的事情。 事实上,语言关键期在研究界是很有争议的。 语言真的有关键期吗?

我们很确定,说话是有一个关键期的,所以我们建议可以在孩子一岁之前给孩子听外语和音乐,可以起到磨耳朵的效果。 这种效果确实存在。

但对于更高级的语言功能,如语义和句法,包括我在内的许多科学家认为,没有足够确凿的客观证据来支持这一假设。 换句话说,在座的各位,如果你现在决定学习俄语或希伯来语,还不算太晚。

另外,还有一点值得一提,就是我们在谈到关键期的时候,往往会关心什么时候在之前,但其实我们也需要关注什么时候应该在之后。 比如我们刚才讲到词汇习得易语言怎么写语音识别,如果孩子共同注意的社交能力还没有形成,过早地促进后期语言能力的发展可能会适得其反。

最后,想和大家分享一句我朋友的一句话。 他表示,早教机构最大的竞争对手是知识水平高的全职妈妈。 这句话不完全正确,但我认为在早期教育中,一是了解大脑发育本身的规律,二是给孩子提供优质的陪伴和充分的社会交往,这会影响他们的语言和认知能力。 发展是最重要的。

好的,谢谢大家。

每日话题

你有没有因为所谓的“语言关键期”而焦躁不安? 留言区聊聊吧!

-结尾-

文章来源|一席,ID:yixiclub,授权主讲丨蔡青,华东师范大学心理与认知科学学院教授。

赞(0)
未经允许不得转载:AXZ博客 » 易语言怎么写语音识别(语音信号处理与识别)
分享到

评论 抢沙发

登录

找回密码

注册