只能说,多数词是频率较高的组合。
一些虚词的搭配,频率也很高,但不是词,例如“但不、的了、可很”之类的。
还有些低频词,出现率极低,但会对应明确的概念,是词。
音乐、美术中的也会经常出现重复元素的组合,但不建议看成是词,艺术方面使用“形式美法则”来分析,“重复”属于形式美中的“节奏、韵律”法则
这是因为艺术要表达的东西和自然语言是不同的,语言要表达一些明确的概念,所以通过词汇来对应,但艺术一般不去表达那些很明确的东西
SHE的《不想长大》听过没?“我不想、我不想、不想长大,长大后世界就没童话,我不想、我不想、不想长大,我宁愿永远都笨又傻”,这两句其实是抄袭莫扎特四十号交响曲的主旋律,从这几句的旋律可以听出在重复中引入的变化和递进上升感。
某些建筑、图案、美术作品中确实存在一些类似词汇的元素,例如哥特建筑的尖塔、尖拱、肋架拱顶、飞扶壁、玫瑰花窗、三叶草窗、石像鬼这些元素的反复出现,既符合形式美法则,又表达了一定的寓言。
相同序列的发觉,一般是用于压缩算法。例如zip压缩中的LZ77算法,是首先查找字符串中某个范围内重复出现的那些短语,然后用较少的字符来替代,以此实现压缩。