科研助力|这次升级必可拯救你脱离论文苦海:BCC对比与词云功能墙裂上线!
新闻:人工智能技术取得重大突破,广大群众喜闻乐见。
文学:人工智能所创造的辉煌,触动着每一颗跳跃的心灵!
科技:人工智能取得了社会不可忽视的进步。【高冷的令人胆寒……】
……
喂喂喂,飞熊君,你玩儿够了没有?快写论文
但是语域确实改变了语言现象的分布
带来了可接受度的差异
甚至可以激进地说
不同语体和语域有着
不同的句法语义规则!
这不都是写论文的套路么
因此BCC语料库向来重视语域的区分
不断成长的BCC新近添加了“学生作文”频道。原有的“综合”频道更名为“多领域”(你看,这样就不造成误解了吧:这个频道是多领域语料的平衡采样,而不是各领域的加和!)
然而最大的改进还是搜索按钮旁边的“对比”功能!按下它……开启意外之旅!
我们以文学为例,让我们来看看单语域对比的功能。选择单一来源,再选择一种语域,如文学。在后面照常输入检索式。图中的检索式的意思是“可爱的+名词”和“帅气的+名词”。关于检索式,请关注汉语堂后,回复“BCC”或点击BCC按钮。
神奇的事情发生了!对,你看到的是词云!大的字符表示频次高的,鼠标悬浮可以显示具体次数。原来在文学语料中“可爱的”孩子最多,女孩次之;而“帅气的”脸最多,男人次之……
如果你想获得所有搭配的具体频次,可以从左上角点击列表显示
我突然觉得按一下按钮,我的论文一章就写完了……
辣么,飞熊君,多语域呢?答:更加精彩!
选择“两个来源中”,然后点选需要对比的语域,比如“文学”和“科技”,让我们看看“帅气的n”这个搭配(好吧,构式……)有怎样的分布!
微博君:帅气的靓仔、帅气的男士、帅气肩章、帅气的牛仔……(微博上看来有不少卖货的……)
文学君:帅气的脸(果然是个看脸的领域)、帅气的男人、帅气的小伙子、帅气的男子……(真没创意……)
比帅气的男子更帅的是……还有柱状图显示!天呐!我这不是又写完了一章么!
使用BCC数据的同学记得引用这两篇文献哈
我知道你们都在凑文献数量
飞熊君送上
荀恩东, 饶高琦, 谢佳莉,等. 现代汉语词汇历时检索系统的建设与应用[J]. 中文信息学报, 2015, 29(3):169-176.
荀恩东, 饶高琦, 肖晓悦, 臧娇娇. 大数据背景下BCC语料库的研制[J],语料库语言学,2016(1).
本文来源:汉语堂
相关文章推荐阅读:
科研助力| New release of BFSU PowerConc August 2016
读书小札| 语料库翻译学视角下术语翻译策略的历史文化解读:读黄立波、朱志瑜”严复译《原富》中经济术语译名的平行语料库考察“