一个错误百出的博客

我有一个很好的、认识大致有六七年的朋友。前两天打电话，他提到他的性格，说了（大致）是这样的一番话：我其实已经算是挺浑的了，就是和你呆在一起的时候，我才（显得）不那么浑一点儿。我这么说你是不是也不知道这个「浑」是什么意思？那就对了。对于我呢，我是有意识的知道我什么时候要浑一点儿，我的正常状态还是挺和大家融得进去的。你呢，你是有意识的知道什么时候要表现出的「正常」是什么样子，正常状态还是挺浑的。某种意义上来说，我觉得这个描述很贴切。我想从这里引申出几点，算是提供一些信息和我个人的思考给大家。接下来的很多话在很多地方都能看到，简直被说烂了 —— 但我想提供一个不太一样的，讲这些东西的方式，这样也许能够帮助到和我比较像的人。补充一点背景：我所从事的工作领域中有一部分和所谓的「人工智能」这个大领域相关；这部分比喻所涉及到的专业知识，我会尽量确保精确程度，但是如果希望从事该领域的工作，希望你可以重新检查所有概念的定义。首先，（我觉得大家应该已经明白这件事，）绝大多数人在使用不太一样的思维模式。「绝大多数人」这个词多少有一点容易让人虚构出一个庞大的群体，所以我们不要说「绝大多数人」。我们说各种各样的人，我们说身边的每一个人。观察身边的人。当他们面对某种（生活中的）情境的刺激时，他们会如何反应？他们为什么会这样反应？接下来，把他们放到群体中。当你已经对个体有一定程度的预估后，观察显性和隐性的群体内部的互动模式。当一个人产生反应了之后，其他人会如何对这个人的反应产生反应？人们对于事物的态度是如何互相影响的？但是，我们明明 “知道“ 我们的某种方式是更「对」的，为什么我们要去探究这种思维模式上的不同呢？这种「更对」的后面其实缺少支撑，因为对错在我们这个世界上没有不可动摇的意义 —— 这就意味着这个「更对」其实只是你的个人观点而已。当然，这同时意味着，别人认为你「错了」，其实也只是他们的个人观点而已。这些对待事物的对错标准，在这个意义上同等正确，也同等错误。当然，我的这些观点也同等正确/错误 —— 来，抬头看一眼这个博客的标题！我们暂且不要把对方看作人，把对方看作是一个黑盒系统 —— 我们不知道这个系统里有什么，但我们知道某种输入（信息输入、外部刺激之类的其他东西）一定对应某种输出（信息输出，行为，态度，想法，情感）。更加了解这个系统（包括了解这个系统是如何与其他系统互相作用的）可以进一步帮助你对现实进行建模来预测「当我进行 x 举动时，接下来最有可能会发生什么」这件事。我们把对方看作人，站在人对人的角度上，更好的理解对方 —— 我们的同类，但是又是和我们不同的特定个体 —— 有助于我们更好的理解我们自己。 GPT-3 (ChatGPT) 是通过海量的数据（在这里，海量的人类个体）加上海量的用户反馈（在这里，海量的你与其他人的交流的反馈）来达到一个「通用的文字模型」这样的效果的；人类的学习能力，尤其是举一反三的能力要强得多，所以你甚至不需要那么多的数据，就能达到远超过 GPT-3 的效果。那为什么不试试呢？当然，我也可以轻易的随便说出一些反对我自己的论点。比如：我们身边的大多数人已经是经过我们选择的。而且很难与我们有足够有意义的交流。同时这个行为会耗费大量的时间，潜在来看成本实在是太高。这些当然都是有意义的论点！但，论点不搭配上一个效用函数毫无意义。换句话来说，你得先决定你在乎什么，这些论点才有用。在这个例子里，如果「去和别人交流来理解他人」这个行为对你的消耗就是很大，你觉得它的回报并不够多，你觉得你并不很在乎理解他人和外界的行为逻辑，那你自然会选择不去做。这些是你觉得的。再换句话来说，压根就不存在「仅仅通过事实做出判断」这件事情，事实本身并不能导向判断，判断一定来自于某种偏好。这种偏好常常是「个人」的。更极端一点的情况，就算是计算机来做决定，这种偏好也需要人为引入：在深度学习之前的人工智能系统中，存在所谓的「启发式搜索」(Heuristic Search)。搜索，可以被简单的理解为计算机试图穷尽所有可能性来找到最优解的过程。就算不计入「启发式」这个部分，计算机需要靠某种效用函数 (Utility function) 来决定两个解哪一个解最优；引入所谓的「启发式」之后，计算机就有了「不需要运算到解的最后一步」的能力，可以在解中途的某一步，根据这个人定义的偏好函数，来计算出当前的这一个步骤所属的状态是否是比较好的状态（以及具体有多好）。到今天，深度学习模型都需要定义一个损失函数 (Loss Function)。这个损失函数的设计，一般来源于人对于现实世界的理解（典型案例：Cross Entropy Loss），人对于目标优化过程的理解（典型案例：Contrastive Loss），或者是人对于最后希望目标的预估（典型案例：Reconstruction Loss）。定义损失函数常常能决定一个模型结构的表现；但有些损失函数可以被用在多个任务上，有些损失函数只能用在某个特定任务上才有好的表现，且大多数情况下损失函数定义是多种损失函数的结合。所以，请不要认为自己身上主观的那部分是不好的。我们最好保有客观分析事物的能力 —— 这可以帮助我们更好的获取客观的信息；但如果没有一组主观的偏好（可以是观念、道德准则、情感等），我们会失去做决策的能力。...