Importieren von Taxonomiedaten per CSV Dateien

Wer schon öfters mit Taxonomiedaten gearbeitet hat, wird früher oder später den Wunsch verspüren diese Daten in einem Rutsch zu importieren und nicht einzeln von Hand einzugeben. Besonderes wenn man verschachtelte Daten hat, welche dazu noch in großer Menge vorliegen, wird die Eingabe von Hand schnell sehr zeitfressend und auch fehlerträchtig. Dieser Artikel gibt Tipps für den Import von Taxonomiedaten via .csv Dateien. Denn dabei gibt es mehr Fallstricke als man denken könnte. Dieser Artikel gilt sowohl für Office 365 als auch für SharePoint 2010/13/16 onPremise.

Wir möchten eine Struktur wie unten abgebildet importieren:

Der Import geschieht via csv Dateien. Ein Muster wird dazu praktischerweise mitgeliefert. Sie finden diese Datei, indem Sie auf den Namen des Taxonomieservices klicken und dort auf View a sample import file.

Diese Datei ist schon recht brauchbar, zeigt diese doch eine Hierarchie von geographischen Daten für den Import. Wenn Sie diese Datei allerdings in einem deutschen Excel auf einem deutschen System öffnen, haben Sie nicht viel davon. Alles steht in einer Spalte. Das ist wenig komfortabel.

Auch mit dem Dialog Öffnen, in der Hoffnung dadurch die Daten zu importieren, kommen Sie nicht weit. Wie bekommen Sie die Daten also nun in ein vernünftiges Format wenn Sie damit in Excel arbeiten möchten?

Der Grund für die Formatierung in Excel liegt darin, dass in einem deutschem System das Trennzeichen das Semikolon ist, aber in der Datei –übrigens völlig richtig- das Komma verwendet wird. Die einfachste Lösung ist, öffnen Sie eine neue, leere Exceldatei und klicken Sie auf das Menüband Daten und dann auf Aus Text. Navigieren Sie zu der Datei und fügen Sie die Daten ein.

Dazu müssen Sie einen Assistenten benutzen, welcher im ersten Schritt die Einstellung Getrennt bei Dateityp verlangt. Setzen Sie außerdem den Hacken bei Die Daten haben Überschriften.

Klicken Sie dann auf Weiter und wählen Sie als Trennzeichen Komma aus. Klicken Sie auf Weiter und danach auf Fertig stellen. Fügen Sie die Daten in das bestehende Arbeitsblatt ein. Sie können dann auch die Daten ab der zweiten Zeile entfernen und haben damit immer wieder eine Vorlage zur Verfügung. Das Format ist eigentlich selbsterklärend, wollen wir eine Struktur wie oben erhalten, sollte ein Teil wie die folgende Abbildung aussehen.


Hat man die Daten erfasst, taucht das nächste Problem auf. Natürlich möchte man die Datei wieder als .csv speichern und Excel macht dies auch brav wenn man in Speicherdialog als Dateityp csv auswählt. Allerdings wird Excel die Datei mit Semikolon als Trennzeichen speichern und nicht mit Komma. Damit kann aber der Taxonomieservice nichts anfangen. Ein Blick mit Notepad in die Datei bestätigt dies auch.

Als Workaround kann man jetzt in Notepad via Strg+H alle Semikolons durch Kommas ersetzen und wieder speichern. Dabei lauert der nächste Stolperstein. Hat man Umlaute in seinen Daten, wird der Taxonomieservice diese nicht richtig darstellen. Denn Notepad speichert in ANSI, notwendig wäre aber Unicode.

Nachdem die Datei so vorbereitet ist, kann man wieder in den Taxonomieservice gehen und dort eine Gruppe anlegen. Aus dem Kontextmenü der Gruppe lässt sich dann die Datei importieren.

Das lästige Nachbearbeiten der csv Datei mit Notepad muss nicht sein, allerdings ist die Lösung nicht immer sinnvoll und möglich. Excel nimmt als Trennzeichen immer das global eingestellte Listentrennzeichen der jeweiligen Sprache. Dies kann geändert werden über Systemsteuerung -> Region -> Weitere Einstellungen -> Listentrennzeichen. Bei mir war ein Neustart notwendig und es scheint, dass es nicht immer funktioniert.

Vielen Dank für Ihr Interesse an meinem Blogeintrag.
Gerne beantworte ich Ihnen persönlich weitergehende Fragen zu diesem Thema.
Kontaktieren Sie mich einfach über mein Kontaktformular.

Sie wollen mehr über mich erfahren? Dann gehen Sie auf
http://www.nicothiemer.de

Vorschläge zur Rechtschreibeprüfung (did you mean) der SharePoint Suche hinzufügen

Wenn man sich in der SharePoint Suche vertippt, erhält man manchmal aber nicht immer von SharePoint einen Verbesserungshinweis in der Form Meinten Sie: oder Did you mean. Dabei sucht SharePoint im schon angelegten Index und seinen mitgelieferten Wörterbüchern nach ähnlichen Ausdrücken. Dieser Artikel beschreibt, wie Sie SharePoint veranlassen können, dem Suchenden eigene Vorschläge zu unterbreiten oder auch diese zu unterbinden. In meinen Fall habe ich nach Chemnitz gesucht und mich dabei vertippt. Statt Chemnitz habe ich Chemnizt geschrieben. Da das Wort nicht im Index ist, wird mir auch kein Vorschlag unterbreitet.

Voraussetzung für eigene Vorschläge ist eine fertig eingerichtete Suche samt einem Metadataservice aka Taxonomie. Wenn Sie mehrere Dienste für Metadaten haben, bezieht sich der Artikel auf Ihren standardmäßigen Metadataservice. Welcher Dienst das ist, können Sie in den Eigenschaften des Proxys des Metadataservice einstellen.

Die Lösung für das Problem eigener Vorschläge ist so einfach wie clever. Die SharePoint Suche legt beim Erstellen eine Taxonomiegruppe im standardmäßigen Metadataservice an. Hier gibt es jetzt mehrere Termsets, wobei für uns vor allem zwei von Bedeutung sind. Es sind die folgenden Termsets, wobei der Name selbstsprechend ist

  • Ausschlüsse für die Rechtschreikorrektur von Abfragen
  • Inklusionen für die Rechtschreikorrektur von Abfragen

Innerhalb des Termsets werden nun neue Einträge vorgenommen. Jeder Term ist zugleich ein Ausdruck. In meinen Fall habe ich Chemnitz in die Gruppe Inklusionen für die Rechtschreikorrektur von Abfragen eingetragen, sodass jetzt dies vorgeschlagen wird, auch wenn ich mich vertippe.

Vielen Dank für Ihr Interesse an meinem Blogeintrag.
Gerne beantworte ich Ihnen persönlich weitergehende Fragen zu diesem Thema.
Kontaktieren Sie mich einfach über mein Kontaktformular.

Sie wollen mehr über mich erfahren? Dann gehen Sie auf meine Site
http://www.nicothiemer.de

Nico Thiemer