Quantcast
Channel: 《MIT自然语言处理第五讲:最大熵和对数线性模型(第一部分)》的评论
Browsing all 4 articles
Browse latest View live

作者:Harry

Brown语料库怎么这么少呢?3万多个词?难道那些不太常用的瓷都没有被统计进来

View Article



作者:admin

关于Brown语料库的规模我不太清楚,不过这是词型(word type)的统计,也就是无论语料库中某个词出现多少次,这里只统计为一个;而您问的可能是词例(word token)的统计,这个Brown语料库应该很大了。

View Article

作者:Harry

Brown语料库怎么这么少呢?3万多个词?难道那些不太常用的瓷都没有被统计进来

View Article

作者:admin

关于Brown语料库的规模我不太清楚,不过这是词型(word type)的统计,也就是无论语料库中某个词出现多少次,这里只统计为一个;而您问的可能是词例(word token)的统计,这个Brown语料库应该很大了。

View Article
Browsing all 4 articles
Browse latest View live




Latest Images

Pangarap Quotes

Pangarap Quotes

Vimeo 10.7.0 by Vimeo.com, Inc.

Vimeo 10.7.0 by Vimeo.com, Inc.

HANGAD

HANGAD

MAKAKAALAM

MAKAKAALAM

Doodle Jump 3.11.30 by Lima Sky LLC

Doodle Jump 3.11.30 by Lima Sky LLC