人工智能正在迅速改变我们的世界,”机器学习算法”已深入现代技术的方方面面,成为一种必需而非单纯的创新。然而,关于我们如今所使用的机器学习算法是否真正具备自主性以被称为AI的讨论仍在继续,但这并非本文的核心。
本文旨在探讨神经网络与人类思维之间的复杂关系。
当你在谷歌搜索框中输入内容时,浏览器是如何预判你想要的信息的?又是怎样通过移动设备的摄像头在成千上万的照片中识别出人脸的?像Alexa、Siri或Google Home这样的虚拟助手又是如何完成诸如安排会议、获取天气、讲故事等复杂任务的呢?
所有这些问题的答案都与机器学习有关,特别是神经网络。
神经网络究竟是什么?
本节旨在为那些对深度学习一无所知的人介绍基本的神经网络。虽然相关的数学理论相对复杂,但此处的重点是理解神经网络与人类思维之间的联系。
神经元
神经元是神经网络中最基本的单元。神经元的功能是接收前一层所有神经元的输入值(在此情况下,神经元y的前一层用蓝色表示,如x1、x2、x3等),并将每个输入值与其对应的权重相乘。因此,x1与w1相乘,x2与w2相乘,依此类推,所有的乘法运算在神经元y内部进行累加。
y = x1·w1 + x2·w2 + x3·w3 + … + xM·wM
接着,使用激活函数如Sigmoid、tanH、ReLU等将求和结果转换为输出值。那么,这些激活函数是什么呢?下面以Sigmoid激活函数为例。
Sigmoid激活函数将任何输入值(在这里,求和y即为Sigmoid函数的输入)转换为0到1之间的值。操作非常简单,只需将输入值及其权重放入激活函数中,你的神经元便会输出一个值。
简单的神经网络
这一过程与神经网络的运作是相似的。如你所见,每个灰色圆圈代表一个神经元,这个神经网络包含三层:输入层、隐藏层和输出层。
现在,神经网络能够自主处理任务,但它们是如何学习的呢?当然,学习的关键在于数据。我们将在下一节深入探讨数据学习的更多内容,但现在可以确定,数据通过输入层进入神经网络,在隐藏层内进行处理,最后由输出层产生结果。
将图像分类为猫和狗的神经网络
举个例子,如果你希望一个神经网络能够识别猫和狗的图像,那么你需要将猫和狗的带标签图像(标记图像意味着我们为神经网络提供了正确的答案)输入给神经网络,经过处理后,神经元会判断图像是猫还是狗。通过得到图像的答案,神经网络便会调整不同神经元间的权重,以提高识别的准确性。
人类思维如同一个庞大的神经网络
你是否观察过学步的小孩在玩耍时的样子?他们总是充满好奇,渴望探索周围的世界。幼儿的大脑宛如一个简单而未经训练的神经网络,自出生以来便开始学习。由于早期的神经网络相对简单,幼儿所学的多是一些基本的任务,如走路、吃东西和爬行等。
当一个正在学走路的孩子手握一个球时,他会观察球的重量、形状、握住的感觉以及皮肤感受到的变化。这些观察是他学习过程的初步阶段,实际上也在帮助他成长。幼儿与球的互动训练了他们的大脑,为未来的活动做好准备。
随着经验的积累,当他再次看到球时,他会忆起球是什么,握住和投掷的感觉如何。随着玩球次数的增加,学习便逐渐形成。尽管投球看似简单,但孩子在成长过程中积累的学习并非易事。
正如前文提到的,孩子的大脑如同一个简单的神经网络,能够完成基本任务,例如走路、吃饭、说话等。随着孩子的成长,他们学会了更为复杂的技能,如手眼协调、流利表达和不洒饭等。
有过训练神经网络经验的人会认为,训练一个简单的网络相对容易,但随着神经层数的增加,数据和输出的复杂性提升,学习的速度便会减缓。童年是学习新技能的最佳时期,因为与成年人相比,孩子的神经网络更为简单,大脑未受过训练,因此更容易适应新的知识。
随着年龄的增长,当任务变得复杂时,学习也愈发困难。例如,解决复杂问题、做出决策和判断都是挑战,成年人依然在不断学习与成长。大脑始终处于学习状态,那么这种学习究竟是如何发生的呢?
答案在于大脑的重塑能力。就像神经网络中神经元之间的权重和连接会发生变化一样,大脑也在改变数十亿神经元的连接,以便让复杂的神经网络不仅保留以往的学习,还能在此基础上不断深化,提升最终过程的复杂性。
当你阅读这篇文章时,你大脑中的每一个神经元都在发生变化,改变与其他数十亿神经元的联系,基于你自出生以来的经验不断增加新的知识。这便是学习的本质。每当你学习时,脑部都会重塑,这个过程与训练神经网络如出一辙。
数据的重要性
如今,科技巨头们最看重的便是消费者的数据。原因在于数据驱动着”机器学习算法”的发展。数据是训练神经网络的基础,没有数据便无法进行学习。你一定见过这样的验证码:
对于你来说,回答这个验证码或许易如反掌,但让一个孩子来做,他可能会答对,但速度却很慢。实际上,每当你在网上完成这样的验证码时,都是在帮助训练机器人或神经网络。你在为真正为你服务的模型准备数据,可以说,你已经在训练许多重要的模型。
正如我们为人造模型准备的数据至关重要一样,人类大脑也是一个贪婪的网络,时刻在你生活的每一瞬间获取海量数据。数据在塑造你,帮助你学习,让你成为智能的存在。这引导我们进入有关人类大脑学习外界数据的最终层面,即输入层或五感。
五种感官
神经网络通过输入层接收数据,以理解和处理信息。数据随后传递到隐藏层进行训练,权重发生变化,最后输出层给出预测,无论是判断图像是猫还是狗,还是根据已有的单词完成句子。
由于我们将人类思维比作一个庞大的神经网络,只有当这个网络也有一个输入层时,它才得以清晰呈现。视觉、听觉、触觉、味觉和嗅觉构成了大脑的输入层。
视觉是五种感官中最为重要的,因为信息的变化主要来自这一感官。训练神经网络的最佳数据集应包含多种类型的数据与示例,而不仅限于单一数据。单一数据的训练会导致模型过度拟合,这意味着模型可能在训练数据上表现良好,但当遇到不同的数据时,准确性便会受到影响。
在生活中,大多数重要的学习过程都依赖于视觉。无论是走路、吃东西、学习骑自行车、弹钢琴,还是与他人交流、在电脑上打字,几乎每项任务都需运用到我们的眼睛。
听觉同样重要,尤其是在早期人类需要在野外觅食时,耳朵专注于捕猎目标发出的声音,生存依赖于此。
触觉是人类最珍贵的感官之一,它能让我们远离烫手的炉子,避免给婴儿喂热牛奶,使我们能够接触到想要触碰的对象。
虽然嗅觉和味觉对神经网络的学习贡献不大,但它们也有其独特价值。这些感官在生活中帮助我们探索乐趣,感受鲜花的芬芳,品尝美酒的醇厚,体验生活的美好。
现在,我们已经理解了输入层、数据及神经网络的处理过程。接下来,通过拼凑所有的拼图块,我们可以看出更大的画面,即模式识别。
模式识别
以学习阅读为例。视觉在这一过程中至关重要。孩子们在学习阅读时,需先掌握字母,通过反复观察、尝试发音并书写来进行练习。每次读、说、写都在训练大脑,提高准确性,直至能够完整书写字母表。
在神经网络经过相对简单的训练后,孩子能够将字母串联起来,听觉在此时开始发挥重要作用。当他说出这些字母时,便开启了对单词的识别模式,理解26个字母如何不同组合形成大量单词。
这种模式识别至关重要,帮助孩子识别人脸、动物或玩具。成年人的模式识别能力更为强大,经过大量训练,能够处理海量数据,从而识别出周围的模式。根据经验预测天气变化,依据记忆和经历推测事件结果,都是模式识别的体现。例如,福尔摩斯通过发现商队中的莫里亚蒂教授的袖子上有粉笔灰尘,进行推理,这也是一种模式识别。
尽管笔者先解释了神经网络的工作原理,再将人类思维与之相比较,但实际上,这一顺序是相反的。人类思维启发了神经网络的构建。否则,为什么这些微小的功能被称为神经元呢?
人类思维是一个极其复杂的系统,产生了世界上每一个思想、行动、记忆、感受和经历。进化赋予了人类强大的工具,而我们今天试图将其复制到人工思维中,这种近乎奇迹的技术便是我们所称的神经网络。
