Excel-Formel: Text normalisieren -

Inhaltsverzeichnis

Generische Formel

=LOWER(TRIM(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A1,"("," "),")"," "),"-"," "),":"," "),";"," "),"!"," "),","," "),"."," ")))

Zusammenfassung

Um einen Teil der natürlichen Komplexität von Text zu entfernen (Interpunktion von Streifen, Groß- und Kleinschreibung normalisieren, zusätzliche Leerzeichen entfernen), können Sie mithilfe der Funktionen TRIM und LOWER eine Formel verwenden, die auf der Funktion SUBSTITUTE basiert.

Kontext

Es kann vorkommen, dass Sie vor einer anderen Verarbeitung einen Teil der Variabilität des Texts entfernen müssen. Ein Beispiel ist, wenn Sie bestimmte Wörter in größeren Textzeichenfolgen zählen möchten. Da Excel keine Unterstützung für reguläre Ausdrücke bietet, können Sie keine genauen Übereinstimmungen erstellen. Wenn Sie beispielsweise zählen möchten, wie oft das Wort "Fuchs" in einer Zelle vorkommt, werden Sie am Ende "Füchse" zählen. Sie können nach "Fuchs" (mit einem Leerzeichen) suchen, aber das schlägt mit "Fuchs" oder "Fuchs" fehl. Eine Problemumgehung besteht darin, den Text zuerst mit einer Formel in einer Hilfsspalte zu vereinfachen und dann die Anzahl der vereinfachten Versionen auszuführen. Das Beispiel auf dieser Seite zeigt eine Möglichkeit, dies zu tun.

Erläuterung

Die in diesem Beispiel gezeigte Formel verwendet eine Reihe verschachtelter SUBSTITUTE-Funktionen, um Klammern, Bindestriche, Doppelpunkte, Semikolons, Ausrufezeichen, Kommas und Punkte zu entfernen. Der Prozess läuft von innen nach außen ab, wobei jedes SUBSTITUT ein Zeichen durch ein einzelnes Leerzeichen ersetzt und dann an das nächste SUBSTITUT übergeben wird. Das innerste SUBSTITUT entfernt die linken Klammern, und das Ergebnis wird an das nächste SUBSTITUT übergeben, das die rechten Klammern entfernt, und so weiter.

In der folgenden Version wurden Zeilenumbrüche hinzugefügt, um die Lesbarkeit zu verbessern und das Bearbeiten von Ersetzungen zu vereinfachen. Excel kümmert sich nicht um Zeilenumbrüche in Formeln, daher können Sie die Formel unverändert verwenden.

= LOWER( TRIM( SUBSTITUTE( SUBSTITUTE( SUBSTITUTE( SUBSTITUTE( SUBSTITUTE( SUBSTITUTE( SUBSTITUTE( SUBSTITUTE( A1, "("," "), ")"," "), "-"," "), ":"," "), ";"," "), "!"," "), ","," "), "."," ")))

Nachdem alle Ersetzungen abgeschlossen sind, wird das Ergebnis durch TRIM geführt, um Leerzeichen zu normalisieren, und dann durch die LOWER-Funktion, um den gesamten Text in Kleinbuchstaben zu zwingen.

Hinweis: Sie müssen die tatsächlichen Ersetzungen an Ihre Daten anpassen.

Hinzufügen eines führenden und nachfolgenden Leerzeichens

In einigen Fällen möchten Sie möglicherweise am Anfang und am Ende des bereinigten Textes ein Leerzeichen einfügen. Wenn Sie beispielsweise Wörter genau zählen möchten, möchten Sie möglicherweise nach dem Wort suchen, das von Leerzeichen umgeben ist (dh nach "Fuchs", "Karte" suchen), um falsche Übereinstimmungen zu vermeiden. Um einen führenden und einen nachfolgenden Leerzeichen hinzuzufügen, verketten Sie einfach ein Leerzeichen ("") an Anfang und Ende:

=" "&formula&" "

Wobei "Formel" die längere obige Formel ist.

Interessante Beiträge...