Mit Hilfe von Regulären Ausdrücken kann man Programme schreiben, die große Textkorpora nach bestimmten Zeilenfolgen durchsuchen können.
Ein regulärer Ausdruck, der einesolche Suche nach bestimmten Zeichenfolgen durchsucht, ist der Unix- Befehl grep, Global Regular Expression Print.
Variationen von endlichen Automaten, z.B. Markov-Modelle, n-gram Modelle, mit deren Hilfe man die Wahrscheinlichkeit berechnen kann, mit welcher bestimmte Wörter auf ein vorheriges Wort folgen, sind ein allgemeines statistisches Hilfsmittel.
Endiche Automaten und Variationen von ihnen werden häufig verwendet bei: