CMU 11611 的课程笔记。这一篇介绍拼写的检查和更正,主要研究打字者键入的文本,同时这样的算法也可以应用于 OCR 和手写体识别。
NLP 笔记 - Words, morphology, and lexicons
CMU 11611 的课程笔记。
推荐系统--开坑
主要介绍推荐系统分析框架、应用场景以及评测方法等。
深度学习-从线性到非线性
这一篇讨论常用的非线性激励函数。
卷积神经网络 CNN 笔记
CNN 对模式分类非常适合,其最初是为识别二维形状而特殊设计的,这种二维形状对平移、比例缩放、倾斜或其他形式对变形有高度不变性。
数据结构和算法 -- 堆
最快找到一堆数里的最小值–最小堆。
kNN 小结
回顾传统 kNN 算法以及优化方法。
新的开始
一直提醒着自己,不要活成别人的样子,然而一天天,一年年,还是偏离了初衷,走着别人认为正确认为光明的路。
Distributed Systems笔记-NFS、AFS、GFS
CMU 95702 关于 NFS、AFS、GFS 的笔记。
Search Engines笔记 - Diversity
CMU 11642 的课程笔记。一个 query 可能表现了不同的信息需求,之前的相关性模型可能带来的结果是大多文档只能满足同一个信息需求,所以有些用户满意了,有些 user 抓狂了。我们希望检索到的 document 是能够 diverse 的,这样的话可以尽可能的满足不同用户的需求。这一章就讲了怎么实现 diversity。