未来简史读后感.

尤瓦尔赫拉利是很少见的带着启蒙时期气质的那种学者, 这种学者往往涉猎广泛, 对理智的力量拥有强烈的信念, 也执着地去使用这种力量去把握这个混乱的世界. 近代以来, 学科分工明显, 专家们往往对其他领域所知甚少, 当谈论到社会的重大议题往往说"从XX科学的角度来看, 如何如何", 或者干脆告诉, "我不做这方面研究, 不便对此发表意见". 这样当然严谨, 却也让知识的破碎化日益严重. 面对朋友圈和头条推荐里的海量信息更觉无所适从.

这种气质的差别也是对于简史三部曲争论的原因之一. 随着<未来简史>的热销, 对这本书的负面意见也随之出现, 或者攻击赫拉利对理工学科的学科进展细节错漏, 或者攻击赫拉利的超人类主义过于傲慢. 但是到目前为之, 在我看过的反对意见中, 还没有一种能切实站得脚的.

赫拉利开宗明义曾经说过, <未来简史>只是提供一种对于未来的可能性, 我们只有思考这种可能性, 才能对这种未来的各种可能做出取舍, 说到底, <未来简史>所做的事情是一种对于历史脉络走向的推演, 在这种推演的时间尺度面前, 计算机的图像识别能力是在1990年超过人类, 还是2020年超过人类, 其实无关宏旨, 惟一重要的是, 有没有力量阻止技术进步, 以及这种进步是否最终会超越人类.

明白了这一点, 面对一本被众人推崇的畅销书时, 便可以更平和地去思考书中到底谈了什么.

技术进步会停止么

看起来不会, 但是为什么, 赫拉利对这个问题的讨论就已经值回票价.
首先, 没有人能够预测未来具体会变成什么样子, 就像前面所谈的, 当今科学的分工过于精细, 不同领域之间相互影响错综复杂, 而专家则各有所长, 各人站在自己学科的视角之内, 无法预料到其他学科的发展会对本领域产生什么影响, 举例来说, 两年前, 在神经科学领域, 研究人员面对大量的生物学数据无法提出一个有效的大脑模型, 然而两年之后, 随着人工智能的发展, 已经开始有学者使用计算机自动学习脑神经数据, 然后再将学习的结果拿来去预测大脑活动了. 假以时日, 大脑活动的奥秘有可能以这样一种方式被揭示出来.

这就是学科之间相互启发的一个例子, 当不同的进展各自发展到一定程度, 就自发地开始结合, 从而涌现出更令人惊叹的成果.

同时, 另一方面, 我们社会发展的需求也不允许我们停止技术进步, 工厂必须用更多的钱来赚取利润, 政府需要有更多的税收来解决社会问题, 这就需要更多的消费, 更新颖的产品, 更体贴的服务, 说到底, 社会被欲望推动着运转, 一量一个环节停止, 接着就是大规模的动作失灵和更多的问题. 而技术发展虽然带来了生态破坏, 环境变暖, 贫富等等问题, 却同时会涌现出新的技术来解决它, 想想北京脱销的空气净化器就能明白这其中的逻辑.

或者我们会希望科学界能够具有更强的自我约束, 在技术发展前, 都能够对其进行审核, 然而这同样也是不可能的.
正如去年的贺建奎事件, 不同于大众对妖魔化基因编辑这个事情的看法, 科学界的反对声音主要是由于, 基因编辑技术的不成熟. 而假如技术成熟呢, 如果你手握救人能力, 能够坦然面对一个生下来就要被罕见病的病痛折磨的小女孩么?

如果坚持不救, 也许避免了未来被基因超人统治的恶梦, 但是却要面对等死的小女孩的哀嚎.
而对于技术来说, 往往能够用于治癒的技术, 也同时能够被用来强化. 日本资料欠缺, 能源不足, 发展核能是为了生存, 但是核能的发展同样可以快速地转换为核武器. 假如能够修复基因缺陷, 拥有基因编辑能力, 那同样也就意味着拥有基因强化成为超人的可能性.
但是, 为了治癒, 同样也不能停止技术进步.

技术进步会带来什么

如果一件事情是神圣的, 那就意味它不会受你控制, 你会经常把神坛上供奉的神像拿下来把玩, 或者会经常去上面修改雕像的鼻子眉毛么.
距离产生了神圣和意义, 而技术进步的目的是控制.
古时的人相信身体发肤, 受之父母, 不可毁弃, 所以女子会断发寄情, 因为在那个语境下头发是自己的一部分, 像自己的替身一样, 而今时今日, 你爱留什么发型留什么发型, 头发是美丽的, 但是绝不神圣. 这正是一旦能够控制由心, 它就成为了一个器物, 再无意义可言.

事实上, 谈到意义, 对这个问题的可能回答, 曾经有宗教, 幸福, 自由, 探索等等不同的答案. 各种对意义的回答基本都可以纳入这几样事物之路. 共产主义是为天下人谋幸福, 看遍山河大川是为了自由和自己的幸福体验, 家人相亲相爱是为了家人和自己的幸福体验.
对于人类这种受造物来说, 意义是人格的驱动力, 也是进行各种智能判断时的依据所在.

但是正是这个依据, 在技术进步前面越来越摇摇欲坠.

宗教面对科学时, 阵地日渐萎缩暂且不提. 对于幸福而言, 现代神经科学和心理学越来越质疑"自我"这个概念的真实性, 同时脑科学的发展也发展, 往往人在一个决定形成意识之前的几毫秒, 已经可以从大脑神经元活动中预测出这个决定, 换言之, 自我并像人们曾经认为的那样, 是一个决策主体或者执行中枢. 而更像一个有嘴巴的傀儡, 自我意识的惟一作用, 似乎就是将身体这具机器执行的结果, 通过语言这种交流方式来表达出来, 从而与其他个人进行信息交换.

技术的进步在揭示了这一图景之后, 我们步入了彻底的虚空中.

在这样一个虚空, 世界的动作无人值守, 无人观察, 一朵花开了又谢, 谢了又开, 自开自谢, 完全不意味着什么事情.人类的意识进化就像翅膀, 嘴巴, 牙齿一样, 只是一个方便物种适应环境的工具. 也完全没有什么出奇之处.

如果论探索环境, 机器未来比人类探索得更好, 论物种适应, 硅基生命对宇宙的利用和改造也终有一天可能大大超过碳基物种.

从意义上看自己, 我们发现毫无意义. 从作用看自己, 我们发现自己终将越来越没有作用.
这就是未来简史中, 关于"人本主义新宗教"倒塌之后的世界.

隐约的希望与未知

之所以说隐约的希望, 是因为当前意识科学的发展并没有给出一个确定的图景, 关于自由意志, 意识的奥秘等等人类意义最核心相关的几个科学议题, 尚未尘埃落定. 或许我们不必马上死心.

但是站在这么一个悬崖边上, 看着寒风中这盏孤灯阴灭晦明, 对于我们为何要来到这个世界上, 相信各人都会别有滋味.

结尾诗

木末芙蓉花,
山中发红萼.
涧户寂无人,
纷纷开自落.

注: 本文只涉及<未来简史>中的几个观点, 欲对其有更全面的了解, 通读全书是一个更推荐的作法.

1955年赴莱比锡抒怀

白远

我懂得灾难,懂得贫瘠。
因为我出生后的第一眼,
看到的是烽火,看到的是饿殍。
你听到了吗?妈妈!

我要让你富强,
我要让绿树覆盖您的河流,
让太空亮起您的灯火。
听到了吗?妈妈!

我是您的希望吗?
告诉我如果有一天,
我的财富如河流如太空!
我死后啊,也决不会带走!

留给这片土地吧!
让它永远沐浴在春天,
留给我的那些婴儿吧!
让他们快乐的活着并繁衍。

我会赤裸地死去!
赤裸成灰烟!
不带走一粒尘埃,
你听到了吗?妈妈!

——摘自《沉默的证人》

计算神经学-甲一, 概述与神经元基础

大概在四年前了解到计算神经学这一学科. 当时感觉这应该是自己最终的归宿, 先后在coursera上跟过神经元与脑、 计算神经科学两门课程, 但是都没有完成.

17后期到18年, 由于个人感情的问题, 整个人的成长接近停滞. 今年好容易状态恢复. 又拾起这本dayan & abbott经典的<Theoretical Neuroscience>, 准备系统的入个门.

概述

意识问题是现代科学的基本问题之一, 不同的学科对之有不同层次的理解, 并分别试图从各自的角度来解决这一问题.
生物物理学从的意识的物理材料入手, 研究神经元、 神经回路的物理性质、电化学性质, 以此来理解意识问题. 神经科学试图从神经元, 大脑皮层的层面来探索不同脑组织的功能, 通过整合不同大脑模块, 形成意识的初步图景, 这两者都是从还原论的视角来逼近意识问题.
而心理和认知科学则从功能应用的角度出发, 探索意识的作用, 汇总在面临不同情况时, 意识的反应模式及其功能表现, 试图通过描述意识的外在表现来了解意识.
同时还有人工智能学科, 通过数学与统计学, 在类比建模的基础, 使用电子芯片来完成类似于意识的同样功能, 从而反推意识问题的计算本质.
然而, 前两者过于微观, 事实上, 从细胞到组织, 从组织到大脑之间, 这些不同层次间有着巨大的鸿沟, 整体并不等于个体的简单加和, 这也就是网络科学所谈的"涌现", 因此, 单纯地研究单个细胞的功能对理解整体固然有益, 但是不从全局的视角来理解每一部分所起的作用的话, 很难将纷繁的生物组织性质纳入统一的框架. 从而总结出具有启发性的观点.
心理与认知科学则过于聚焦在对不同功能的列举性描述, 缺乏对于不同认知功能的系统性归纳. 对于研究意识来说, 目的性不强. 而人工智能的曲线救国路径, 虽然能够建造精妙的智能机器, 却仍然需要更多的工作来去芜存精, 对所推出与的结论与神经科学的生物事实放在一起, 进行关联比较分析, 厘定到底哪些是意识计算所必须和共通的部分, 而又有哪些是受限于特定的计算架构和算法的, 独特的部分(如gpu分布式计算, 或反向传播算法).

计算神经科学, 就是这其中缺失的一环.
计算神经科学, 致力于汇总不同层次的已知实验现象和解剖学事实, 归纳比较不同生物组织的功能和作用, 通过数学和信息论的视角来将这些知识综合在一起, 解释从生物神经元、 神经回路到心理行为的计算过程. 对于智能提出一个统一的框架.

简单来说, 就是分析神经系统能做什么, 它们是通过什么结构, 利用哪些性质来做到的. 为什么它们要通过这样的方式, 组织成这样的形态来完成这一目的.

三种模型

计算神经学科中的模型的可以分为描述性模型, 机制性模型和解释性模型三种.

描述性模型(descriptive models)

描述性模型整理某一类神经元或者神经结构的大量实验数据, 总结这些数据, 并提出一个计算模型, 这个模型能够良好的适配数据, 说明该神经元或者神经结构都做了什么. 举例来说, 假说我们现在要提出一个神经元的描述性模型, 我们拿到不同实验中, 神经元的输入动作电位和输出动作电位, 然后我们提出了McCulloch-Pitts模型, 完美解释了之前的实验数据, 那么这就是一个很好的描述性模型, 描述性模型更像是一个黑盒模型, 在这里, 我们关心的是神经元到底做了什么---轴突加权和, 非线性转换并转出---而不关心它是怎么做到的.

机制性模型(mechanistic models)

机制性模型则更进一步, 需要理解神经元是怎么做到, 以上面例子来讲, 在神经元的生物形态中, 怎样通过轴突, 树突, 细胞膜和这离子通道来实现一个 *非线性加权和* 的电位过程, 这就需要把解剖学事实、生物物理性质、以及之前的输入输出数据结合在一起, 给出一个符合观测的过程说明. 机制性模型通常会把不同层次的描述性模型联系起来. 还以神经元为例, 在神经元的层面, 一个描述性模型是McCulloch-Pitts模型, 而在离子通道层面, 我们又有一个描述离子通道的翘翘板数学模型(临时起个名字), 那么一个好的机制性模型就会联系这两者, 结合解剖学结构, 说明一个翘翘板样电位值变化如何嵌入非线性加权和的模型中. 从而解释神经元做了什么, 是怎么做到的.

解释性模型(interpretive models)

解释性模型更为宏观, 一般会从可计算理论以及信息论的角度出发, 来理解为什么神经元要这么做, 一个非线性加权和的操作对于这个神经元参加的认知功能是必要的么, 为什么神经元会形成这样的机制, 以这样的执行方式来处理这个问题. 这就是一个典型的解释性模型所要回答的问题.

书的章节安排

本书分三大部分, 一是神经编码和解码, 二是神经元和神经回路, 三是适应和学习.
神经编码和解码主要讨论, 神经系统是通过何种方式把不同的外部信息存储在大脑中的, 这种信息编码方式是什么, 以及在需要对外界反馈的时候, 又是如何将内部编码进行解码, 最终无碍且智能在这个大千世界中行走的. 也就是说, 神经元是如何存储图像, 声音, 文字, 运动反馈等等不同信号的, 又是如何将这种存储提取出来转换为外部信息对外界进行反应的.

神经元和神经回路讨论神经元和实现机制, 电传导机制, 并进一步在神经元的基础上, 讨论神经元聚合之后的神经回路(神经网络)的种类和功能, 在这一部分, 有大家喜闻乐见的前向神经网络, 递归神经网络, 兴奋抑制网络和随机神经网络等内容.

最后一部分将探讨神经可塑性, 经典条件反射与操作性条件学习, 以及当下大热的Representation Learning.

神经元的生物结构与神经脉冲

神经元的基本结构已经是众人皆知的模型了, 地球人都知道它由轴突(axon), 树突(dendrites), 细胞核(the soma of cell)三大部分组成, 其中轴突输出, 树突输入, 细胞核处理输入. 整个输入输出以动作电位(action potential)的形式传输. 其概念图如下图所示.

那么我们列举一些不那么广为人知的事情:
1. 不同神经元接受的连接数不同, 典型的如皮层金字塔形神经元(cortical pyramidal neuron), 皮层中间神经元(cortical pyramidal neuron)接受千数量级的连接, 而特别的如小脑浦肯野神经元(Purkinje cell)可以接受多达10万个连接.

2. 轴突的传输距离极长, 甚至可以横跨整个身体. 在小鼠的大脑中, 典型的一个轴突长达4厘米, 每毫米平均有180个与其他树突的连接, 而一个树突, 平均每微米就都有两个神经连接. 与之对比的是, 神经元的细胞核直径大约也只有10微米到50微米, 一微米为百万分之一米.
3. 通常将神经元所处的脑容液的神经电位视为0mv, 这样的神经元内部相对与脑容液为-70mv, 此时这个神经元称为极化细胞, 同时此时的电位差称为静息电位.
4. 默认情况下, 带一个正电子的钠离子在细胞外浓度较高, 而同样带一个正电子的钾离子,在细胞内浓度较高. 当离子浓度差或者电位差导致离子泵打开时, 离子可以在细胞内外进行流动. 如果流动导致膜内外电位差增大, 则称为超极化, 而若使其减小, 甚至使其归零, 则称为去极化.
5. 如果去极化的幅度超过阈值, 那么细胞将产生动作电位, 一个典型的动作电位的电位差大约在100mv, 并能够持续约1ms.
6. 在一个动作电位发动后的几毫秒, 基本上神经元不可能再发动另一次神经脉冲, 这个时间区间称为绝对不应期(absolute refractory period)(好想翻译成绝对静默期啊), 而一个动作电位发动后的数十毫秒, 一般很难再发动一次神经脉冲, 这则称为相对不应期(relative refractory period).
7. 一旦称为动作电位, 即指这些能够进行长距离信息传输的惟一脉冲, 而那些电位差阈值不过限的subthreshold potential, 一般只能传输1毫米那么长...
8. 动作电位传输到轴突末端时, 二价钙离子流出, 并导致神经递质释放, 从而引起下一个神经元的超极化或者去极化反应.

嗯, 今天就总结到这儿. 下周见.