徐阿衡

Shuang


  • Home

  • Categories

  • Works

  • About

  • Tags

  • Search
close

数据结构和算法 -- 树

Posted on 2016-09-17   |   In Data Structure   |  
最大最小值python 里找 float 的最小值,float(‘-inf’),最大值,float(‘inf’)找 int 的最大最小值123import sysmax = sys.maxintmin = -sys.maxint-1 其它class 里创建 helper 方法第一个参数传 self, ...
Read more »

Search Engines笔记 - Query Processing

Posted on 2016-09-11   |   In NLP , Search Engines   |  

CMU 11642 的课程笔记。搜索引擎是怎么处理 query 的?三种方法,Term-at-a-time(TAAT),Document-at-a-time(DAAT),TAAT/DAAT hybrids。

Read more »

数据结构和算法 -- 栈和队列

Posted on 2016-09-08   |   In Data Structure   |  
Stack implementation实现一个 stack 可以用两种数据结构,array(dynamic or fixed) 或者是 linked list。 dynamic array 的优势是支持 random access,因为可以通过 index 获取数据,然而 stack 主要作用是 ...
Read more »

数据结构和算法 -- 排序算法

Posted on 2016-09-07   |   In Data Structure   |  

往往排序是作为其他算法的预处理算法,其重要性却不容小觑。本篇讲冒泡排序/选择排序/插入排序/希尔排序/归并排序/快速排序/桶排序/计数排序。

Read more »

Search Engines笔记 - Exact-match retrieval

Posted on 2016-09-06   |   In NLP , Search Engines   |  

CMU 11642 的课程笔记。Exact match retrieval models 对专家来说很适用,它假定人能将需求描述为一个 boolean query,文档要么完全匹配要么完全不匹配,不匹配的文档分数就为 0。

Read more »

数据结构和算法 -- 链表

Posted on 2016-09-04   |   In Data Structure   |  

链表实现/移除节点/链表相加/链表部分翻转/链表改序/链表去重/链表划分/链表的环/链表公共节点问题/链表复制。

Read more »

聊天机器人和智能客服(笔记)

Posted on 2016-08-20   |   In NLP , Chatbot   |  

张辉智能客服分享会笔记以及三个月客服机器人实习的感悟。

Read more »

实习总结之 sentence embedding

Posted on 2016-08-05   |   In NLP , Meaning Representation   |  
5-7月的实习,总的来说主要做了三件事情,一是语料的补充,具体表现是通过编写分布式爬虫从各种渠道爬取相关语料,二是特征提取,这一阶段测试了各种模型,doc2vec, lda, LSI, RNN, CNN 等等,试图在 word2vec 词向量基础上,产生质量更高的 sentence embeddin ...
Read more »

项目实战--云计算Twitter Analytics Web Service

Posted on 2016-07-28   |   In Projects   |  

CMU 15619 Cloud Computing 的 team project,拖了很久,最终还是鼓起勇气整理了。时隔三个多月,回头来看,找到了更多可以优化的点,本篇内容许多是和同伴讨论整理后得出,借鉴了小土刀的博客,然而现在找不到具体地址了抱歉。

Read more »

项目实战--App Recommender System

Posted on 2016-07-22   |   In Projects   |  

该项目从华为应用市场爬取 app 数据,存到 MongoDB 中,再经过推荐算法更新数据,展示到前端。项目综合了之前讲到的所有爬虫技巧,来源自 BitTiger 的组织。项目共分为 爬虫模块、推荐模块、网站模块 三部分。

Read more »
1…121314…17
徐阿衡

徐阿衡

读万卷书,行万里路 @SYSU @CMU

167 posts
19 categories
126 tags
RSS
GitHub LinkedIn 知乎
Links
  • Star
  • Liam Huang
  • Li Bin
© 2016 - 2022 徐阿衡 粤ICP备17129486号
Powered by Hexo
Theme - NexT.Mist