原回答在这儿,没啥人赞还是贴自己专栏吧...
同样反对 的高票答案,比较认同第二高赞的匿名大神的回答,昨天跟 Kaiser 大佬一起吃饭也聊到了这个问题,强人工智能是有可能实现,但是现在的技术离强人工智能的距离确实还非常远,人工智能需要大数据来“喂”,然而即使是信息化程度最高的科技行业和金融行业,其中大多数企业的大数据准备都还做的一团糟呢,可以用以人工智能研究和应用的 “数据原料” 还远远不够,各大企业公关给人的那种欣欣向荣的错觉和企业实际情况大相径庭。
先不扯别的,大家觉得现有的人工智能有多少“智能”的成分在里面呢?我认为现在大部分的人工智能大部分都是在围绕“交互”和“效率”做文章,很少有真正在“智能”上做文章的,因为真要在 “智能”上做文章的话门槛还是很高的,毕竟“智能”更需要的恐怕不是程序员,而是研究人脑的生物学家,研究自然语言的语言学家和研究情感的心理学家...... 我在下面也列出了“交互”“效率”“智能”三者不同的进化路径,大家感受下是不是这样......
- 交互 进化路径
工具(键鼠、遥控器等)—— 手指(物理接触)—— 手势 语音 眼球注视(非物理接触)
- 效率 进化路径
单 —— 多(单窗口 单任务 单人工作 —— 多窗口 多任务 多人协作)
小 —— 大(小屏 ——大屏 —— VR AR 等360°沉浸式体验)
本地 —— 云
- 智能 进化路径
识别(图文 语音等)—— 理解(语法解析 情景判断)—— 经验 ------ 情感?
接下来详细说下我为什么这么理解,大家先来回忆下,上学的时候是不是所有老师都这么说过:「别光记答案,要理解!」是啊,只记答案有什么用呢,下次遇着这个问题还是不会的啊,所以,看见了不代表看懂了,听见了也不代表听懂了。用程序猿们的术语来说就是:识别 ≠ 理解
识别 这个词儿其实大家也很熟吧,文字识别(OCR),语音识别(Siri 微软小冰 小爱同学...)图像识别(人脸识别 验证码识别 条形码识别 发票识别 ),没错,现在的人工智能所能干的也就只有识别,这些识别做的是尽量先去看得懂 听得懂 错误率低,至于理解,想想你调戏 Siri 为代表的各种语音助手表现出来的智障样儿就知道它一定不理解。而真正的人类智慧是在于识别嘛?答案是毫无疑问的吧。
当然识别也是非常有价值的,能从一张图片里面识别出文字信息省了多少手敲的功夫,在不方便用手操作的时候(例如开车的时候)通过语音控制手机导航可以减少安全事故,公司门禁不用刷卡直接刷脸也很方便,超市里买完东西到自助结账的机器前面扫扫条形码和微信支付宝付款码就直接走人的感觉也很爽,借助摄像头识别当前路况 前后车距 环境变化 从而实现无人驾驶 也很酷,借助图像识别技术在农业领域自动除草除虫也非常高效 ...... 还有很多很多工业级 军用级的应用都非常非常有价值,也极大的解放了劳动力,提高了效率。
但是!仅凭这样就说我们可以用同样的方法(机器学习 深度学习),实现“人类级别的智能”,取代所有的人类工作,甚至支配统治人类,那就有点神化了,反正我觉得在我有生之年内(我 94 的)是没啥希望的,为什么呢?因为上面所说到的应用,只需要“识别”出图像内容或语音内容,它不需要“理解”内容背后在表达什么意思。有的童鞋可能就不服气了,微软小冰 小爱同学还是很聪明的啊,好吧,给你泼盆凉水,把你语音说的内容放到百度里去搜索,多翻翻看有没有类似的内容,相信你一定会回来点赞的。所以,这些所谓的智能语音助手其实本质上都是“语音版的搜索引擎”,它根本不懂你在说什么,就把你说的内容的关键字提取出来去搜索,依据分析大量语料得到的拟合函数,随机返回一些匹配程度比较高的词句,各大厂商的宣传视频里看着的确都很聪明,其实更多不聪明的回答大家都心知肚明。至于一些个物联网的智能家居也是同理,这些工具只是听到了你要它干什么,不是听懂了,这是两个完全不同的概念,它只是听到了语音然后转化成一系列指令替你操作了而已,之前是你自己拿着遥控打开开关,调节空调温度,控制电视音量,打开扫地机器人......现在是你喊了句话让机器替你干了这些事儿,所以 这本质上其实是交互方式的转变,不是非智能到智能的转变。
那问题来了,怎么让机器不仅仅是“识别”,而是真正的“理解”呢?“识别”和“理解”的差别,就像程序语言里面“语法”和“语义”的差别。程序语言跟人说的自然语言都类似:
- 首先得先认得单个汉字或者单词 是不是多音字 有没有多个含义(词法),
- 然后再理解几个词连接起来表达的什么意思 连接起来有没有歧义(句法 语法),
- 然后再结合语境和前后文理解这句话到底要表达什么意思(解释 语义)。
程序语言也同样,需要前后经过 词法分析器(lexer)语法分析器(parser)解释器(interpreter)这三步,也只有第三步的解释器才能实现程序的语义。
类比一下,自然语言的语音识别系统,其实只相当于程序语言的词法分析器(lexer)。然而,词法分析和语法分析,只不过是实现一个语言的万里长征的“第0步”。大部分的 AI 系统里面连语法分析器(parser)都没有,所以主谓宾定状补这些句子结构都分析不清楚,更不要说理解其中的含义了(interpreter),相信大多数人也都会像我这种普通人一样,学了十几年英文还是没明白语法,因为特殊情况实在是太多了,人类自己都弄不明白的语言学,就妄图教会机器?或者让机器自己猜?然后变得像人一样聪明?这分明就是要实现“读心术”。不要忘了,机器学习是“举三反一”,不是“举一反三”。
再举个例子,由于有了“个人语音助手”,有人就号称类似的技术可以用来制造 “机器客服”,使用机器代替人作为客服。他们没有想清楚的是,客服看似“简单工作”,跟这些语音控制的玩意比起来,难度却是天壤之别。客服必须理解公司的业务,必须能够精确地理解客户在说什么,必须形成真正的对话,要能够为客户解决真正的问题,而不能只抓住一些关键字进行随机回复。另外,客服必须能够从对话信息,引发现实世界的改变,比如呼叫配送中心停止发货,向上级请求满足客户的特殊要求,拿出退货政策跟客户辩论,拒绝他们的退货要求,抓住客户心理,向他们推销新服务等等,各种需要“人类经验”才能处理的事情。所以机器不仅需要能够形成真正的对话,理解客户的话,它们还需要现实世界的大量经验,需要改变现实世界的能力,才可能做客服的工作。所以任何试图取代“需要思考 需要复杂的经验判断工作”,节省劳动力开销,克扣员工待遇,试图把他们变成“可替换原件”的做法,最终都会倒戈,使得企业收到适得其反的后果。
当然本文也不是弱化 “交互”“效率” 进步的历史意义哈,这的确非常重大,不信去看老罗 515 刚发布的 TNT (乛ᴗ乛) 但这些终究不是真正的 “智能”,而真正的 “智能” 我们现在才刚刚走出去万里长征 第 0 步 —— 识别,仅仅这样就已经可以实现 人脸识别 自助收银 无人驾驶 等等等等很酷的东西,万一有一天机器真的理解了我们这么做背后的含义,也形成了自己的经验,甚至情感,那个时候我们才会面临真正的威胁吧,而那一天现在看起来的确还有点远。
然后,现在市面上的大多数人工智能的文章也好,教程也好,大多都是噱头,的确夸大了其中的 “智能” 成分,闭口不提他们的局限性,让外行们以为人工智能就快实现了。还拿上面的例子来说,“ 语音助手”除了在开车或者双手不方便的时候应用还可以,其他时候真的没啥用,我不会在家里 公司 或者 公共场所使用它们,因为 我懒得说话,或者不方便说话,点击几下屏幕,我就可以精确地做到我想要的事情,这比说话省力很多,也精确很多,这种局限性本来无可厚非,不同情况用不同的交互方式就行了,过分夸大语音的优势就变成弄巧成拙了,这恐怕也正是老罗的 TNT 被黑那么惨的原因。
并且,万恶的资本家知道你在焦虑,在害怕被机器取代,然后就瞄准大家的焦虑点精准营销,贩卖焦虑,贩卖人工智能的相关产品 相关内容,仿佛非得用了 买了 学了 人工智能才可以不被淘汰 才能年薪百万,也的确真的会有很多人花钱营造出一种“看似进步”的假象。毕竟我也思考过很多 尝试过很多 才从焦虑变得从容,才明白作为人类的我 应该对一切生物尤其是人类心存敬畏感。
说这么多,也不是让大家轻视人工智能和科技发展的力量,只是为了从另一个方面辩证的看待问题,不希望有些人过分夸大“人类”的能力,拒绝前沿科技的应用,拒绝交互的优化,拒绝效率的提升,也不希望有些人过分夸大“人工智能”的能力,以为有了它就可以随意替代人类,毕竟连客服这么按部就班的工作,机器都无法取代,就不用说更加复杂的工作了。所以,我们应该敬畏科技,更应该敬畏人类智慧,最好的办法就是二者和谐共存,让机器帮助人类 汇总问题 分析问题 解决问题 共同创造更辉煌的文明史(一下子就圣母起来了哈哈)......
最后声明下,上文内容大量引用了垠神的文章,甚至有些都是直接复制粘贴过来的,至于为什么不直接转发,因为我也在垠神的文章基础上也加了不少自己的想法,但这终究不是我所具备的思想高度,所以文末附上原文链接, 以示尊重。
本文转自 知乎,原文链接:https://zhuanlan.zhihu.com/p/42405010,如需转载请自行联系原作者