如您所知,Reddit 通常是一个友好而愉快的对话场所。所以 Colin Morris分析了 Reddit 评论中复合贬义词的用法:
组合的完整“矩阵”非常密集。在大约 4,800 种可能的化合物中,超过一半出现在至少一条评论中。最常见的复合词, dumbass ,出现在 360 万条评论中,但也有许多罕见术语的长尾,包括 444 个 hapax legomena(在数据集中只出现一次的术语),例如pukebird 、 fartrag 、 sleazenozzle和bastardbucket 。
保持优雅。
原文: https://flowingdata.com/2022/07/01/analysis-of-compound-curse-words-used-on-reddit/