Prml1.2学习笔记-----兼谈离散与连续的世界。

这节讲的大部分东西,也不需要太过于多说的样子,加法法则,乘法法则,联合分布,边缘分布和条件分布,值得注意的是联合概率的英文是the probability of X and Y,而条件概率的英文是the probability of X given y,自己在文科的思维来搞理工,一向缺乏术语的严谨性,经常懂了,向行外人表达得挺清晰,可是在行内人听起来却很成问题。这一点需要克服改进之。 接下来就是机器学习贝叶斯学派最重要的贝叶斯法则

Python gil之三 check

上回书说完了信号和tick,这回书接着来说check。 当某一个主线程运行了100tick之后,经过检查,从而释放了gil锁,并由操作系统调度其他的线程来运行,如图是线程2开始运行,当线程2也运行完100个tick之后,调度线程3.这两次进行的都很顺利,但是线程三在运行时,却出现故障。 如前所述,只有主线程中实现了线程处理函数,可以处理系统广播的信号,而在线程三的这一次运行中,当线程3接收到系统传递过来的信号后,线程3不再等100个tick才去检查,并释放gil,而是每过一个tick都进行一次检查,这样实现的目的是为了尽快地能够将执行转移给主线程,从而能够尽快地响应系统的发出的信号。 但是: python是没有调度权的 在运行check,

PRML1.1学习笔记及其扩展

最近参加完mla2014,深感自己基础还是甚不牢靠,之前断断续续的学习,没有一部内化的大部头做根基,一切都是无根之萍。 好在最近自己的生活节奏和状态都已经调节到看prml丝毫不觉得违和的地步,而且不再焦急地想把它看完,这样的学习状态应该是最好的。于是,进军PRML。 首先是训练集与测试集的概念,泛化,输入空间与输出空间,特征空间,特征提取,监督学习,非监督学习,分类与回归任务,这些都没有什么太多可说的。 此书中提到非监督学习的三个主要任务,聚类,density estimation,可视化,关于density

姑且零乱姑且流水

又是一个不知道说些什么的日子。 近几天外出参加一个会议,虽说不是国际顶级会议,不过参加之后的收获反倒是好像比国际顶级会议还多些。 谈到国际顶级会议,就想到上次参加icaij的经历,上次和那个绕着舌头的日本人沟通,虽然看其墙展,其好像是使用EM算法来分析amazon 众包中某一份任务的标注的有效性,明明看其工作就是很有意思,可是干看着,鸡同鸭讲,怎么也听不懂其圈着舌头的日式英语。 好歹mla2014没有这样的现象。 这会先不谈干货,干货我现在也记不下来,等那边把PPT都放出来了,参考着ppt再回顾那几位大咖位都在干什么。 说是大咖,其实也不全是,第二天下午参会的俞扬,和第一天的大咖,比如马毅,相比就完全不是一个量级的,

Python 之gil之二

之前说到在gil的控制下,如果一个cpu富集(这个词可能不是标准译法,英文cpu bound,指运行时间主要由cpu运算的时间来决定的任务)线程获取了gil锁,然后它会一直运行下去,为了使得其他的线程也能够运行,每次过100个tick,线程会阻塞自身,然后由python解释器来进行一次check。查看是否有其他的线程在等待获取gil。 首先来谈这个tick,这个tick其实是一定的步数的字节码,如果使用python提供的反汇编模块dis.dis来对python代码进行反汇编将之转变成机器码的话,可以看到 如图所示,这些字节码分为四个tick (这里有一点自己现在不明白,这个tick到底是按照什么规则来分配的,为什么有的tick比较长,而有的tick比较短,甚至---)

Episode

00:00:00 00:00:00