欣然妈 发表于 2014-2-24 14:02:32

请问英文书的词汇统计是总词汇还是剔除了相同词汇后的词汇量?

有一些书后边有词汇量的统计,比如632,1089这样的,是书里一个词算一个(不相同与相同的词都包括在内)?还是剔除了相同词汇,只计算不相同的词汇?

elamelam 发表于 2014-2-24 15:03:52

我翻查过一些这方面的论文,字数统计在西方原来已经有两千年以上的历史,这肯定是中西文化一个很不一样的地方(如果谁对这些沉闷的论文有兴趣,我可以发给你)。在近代西方出版界,字数统计有几方面的作用,第一,决定一本书的质量,除了内容和印刷等因素以外,字数也是重要因素;第二,决定该书属于短篇,中篇,还是长篇,这个在西方出版界是有规定的;第三,字数在翻译的时候是决定价格的重要因素。

好了,言归正传,到底一本书后面写着的字数统计,是统计整本书的所有字,还是剔除了重复的字?我相信两种情况都有。假如是低幼的分级阅读类的书,那个字数统计说的往往是生词,有时候甚至不包含 the, a 等字。但是大部分小说,字数统计就是统计所有的字。

欣然妈 发表于 2014-2-24 16:49:12

elamelam 发表于 2014-2-24 15:03 static/image/common/back.gif
我翻查过一些这方面的论文,字数统计在西方原来已经有两千年以上的历史,这肯定是中西文化一个很不一样的地 ...

非常感谢回复。不过我更想问的是,这个统计是不是将重复字算在内。比如很多的the,是算一个还是每出现一个就加入统计数字?希望能得到回复。谢谢。

elamelam 发表于 2014-2-24 17:01:22

欣然妈 发表于 2014-2-24 16:49 static/image/common/back.gif
非常感谢回复。不过我更想问的是,这个统计是不是将重复字算在内。比如很多的the,是算一个还是每出现一个 ...

是我说的不清楚吗?一般小说统计的字就是所有的字,重复的字每出现一次算一个。

硅谷幸福阳光 发表于 2014-2-25 00:36:28

Word count是字数统计,象我们作文800字或1000字,有一个算一个。象一些低幼的书有些统计的是word list count,象the cat in the hat,它的word list count是236,说的是它有236个不同的词,包括a,the这些常用词,名词复数和动词的不同时态算两个词比如look和looked,book和books算两个词

coffeecat3900 发表于 2017-9-18 09:53:42

学习学习学习
页: [1]
查看完整版本: 请问英文书的词汇统计是总词汇还是剔除了相同词汇后的词汇量?