CMU 11642 的课程笔记。垂直数据库能获得更准确的搜索结果。那么对一个 query,我们可以放到合适的多个垂直数据库里检索,然后合并结果呈现给用户。
EM算法
CMU 10601 的课程笔记。EM 算法计算含有隐含变量的概率模型参数估计,能使用在一些无监督的聚类方法上。在 EM 算法总结提出以前就有该算法思想的方法提出,例如 HMM 中用的 Baum-Welch 算法。
Graphical Models
CMU 10601 的课程笔记。EM 算法计算含有隐含变量的概率模型参数估计,能使用在一些无监督的聚类方法上。在 EM 算法总结提出以前就有该算法思想的方法提出,例如 HMM 中用的 Baum-Welch 算法。
论文笔记 - ReDDE Algorithm for Resource Selection
对 Luo Si 和 Jamie Callan 的论文 Relevant Document Distribution Estimation Method for Resource Selection 做的一些笔记。之后会整理 Federated search 这一章的笔记。
Bayesian Learning
CMU 10601 的课程笔记。朴素贝叶斯思想即对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
Hidden-Markov-Models
CMU 10601 的课程笔记。上一章讲了 Bayesian networks,我们发现它对 joint distributions 建模很有用,然而却不能解释 temporal/sequence models,也没法解释循环问题。所以需要引入另一个模型,隐马尔可夫模型(Hidden Markov Model,HMM)。HMM 用来描述一个含有隐含未知参数的马尔可夫过程。难点是从可观察的参数中确定该过程的隐含参数,然后利用这些参数来作进一步的分析。
深度学习-链式反向梯度传导
反向梯度传播实例。
数据结构和算法 -- 动态规划
我们再次强调:动态编程的核心在于,如果在一个问题的解决方案中,子问题被重复计算,那么就可以利用记录中间结果,达到用空间换取时间的目的。
Search Engines笔记 - Personalization
CMU 11642 的课程笔记。关于个性化搜索引擎。
Search Engines笔记 - Document Structure
CMU 11642 的课程笔记。文档的表示形式不只词袋一种,它可以有 fields,有 hierarchical structure(XML),multiple representations of meaning, priors 等形式,这一章讲的就是检索模型怎么来处理这些复杂的文档表达。