说到最近最火的东西肯定是AI,想必大家也很好奇AI这东西怎么工作的。
鉴于目前在各个领域发光发热的模型都是基于深度学习,那么接下来我们就用最好理解的语言说明一下深度学习AI的工作原理吧。
AI也就是人工智能,咱们不说复杂的AI定义,只要明白一点,AI是对大脑的模拟。
人在处理信息的时候往往会先收集周围的信息,拿下围棋来举例,人会观察棋盘上的黑白子分布,然后大脑处理这些信息,然后选择一个地方下子。
在这里,棋盘上棋子的分布就是输入,你采取什么行动就是输出。
你的大脑是如何处理这些数据的呢?容我给大家隆重介绍神经元。
输入经过神经元计算,产生输出
上图就是一个单个的神经元,人类大脑含有数百种不同类型、总数达近千亿个的神经元,神经信号经由神经元间的突触联接所形成的神经环路进行接受、传递和处理。
而每个神经元的粗细是不一样的,粗细不一样也就决定了信号走哪一条路的可能性更高。你频繁锻炼一个技能,必定会使某一条神经通路更强壮,这样你在这个技能上就更强了。
那么AI是如何模拟人类大脑的呢?这里我们就要讲一点枯燥的初中知识了。
我们仔细看这个输入-计算-输出的过程,像不像我们初中学过的方程?如果把y定义为输出,x定义为输入,那么就可以简单的表达为y=wx。这里的w其实就是权重,也就是我们神经元的粗细了。当然光有w是不够的,为了更精准的表达,我们需要偏置项b。这里就不深入探讨b的作用了,总之就是为了涵盖更多的可能性。
所以我们有了y=wx+b,这就是AI的一个节点,当很多层的节点堆叠起来,你就获得了一个AI了。
当我们需要训练一个AI的时候,我们需要收集x和与之对应的y,将数据交给AI模型,然后让他调整参数w和b。当训练完成后,你将新的x输入模型,就能得到y了。
所以本质上现阶段以深度学习为主的图形AI和语言AI的工作原理都是在模仿人类大脑。下次当别人问你AI怎么工作的时候,你可以告诉他,和你的脑袋瓜一样。