PresseKat - Mehr Qualität durch semantische Analyse: Retresco entwickelt neue Software für das Archiv der Sü

Mehr Qualität durch semantische Analyse: Retresco entwickelt neue Software für das Archiv der Süddeutschen Zeitung

ID: 1132144

(firmenpresse) - - Machine-Learning auf Basis der Retresco-eigenen semantischen Textanalyse
- Optimierung archivarischer Arbeitsprozesse durch themengenaue Klassifikation und Visualisierung in einem Wissensnetz


Archive großer Medienunternehmen bergen einen unschätzbar wertvollen Fundus zeitgeschichtlicher Informationen, die sich erst durch automatische semantische Verknüpfungen leicht zu verständlichen Themenclustern zusammenfassen lassen. Eigens für das Archiv der Süddeutschen Zeitung und weiterer Partner der Dokumentations- und Informationszentrum München GmbH (DIZ) hat Retresco eine Software entwickelt, die das themengenaue Archivieren und die Recherche im Archiv dank semantischer Technologien zielgerichteter und ergebnisorientierter gestaltet.

Machine-Learning: Training des Klassifikators auf Basis semantischer Textanalyse
Basis der Lösung ist das Training eines Klassifikators anhand der Retresco-eigenen Semantik. Dazu werden im ersten Schritt sämtliche verfügbaren Archivinhalte hinsichtlich ihrer semantischen Grundstruktur analysiert. Anhand identifizierter Texteigenschaften wird im zweiten Schritt der Klassifikator trainiert, um zu bestimmen, welche Art von Texten in welche der mehr als 20.000 Themencluster und Personen- und Institutionen-Dossiers des Archivs gehört. Zur finalen Zuordnung erhält jeder Inhalt Scorewerte, die die Wahrscheinlichkeit ausdrücken, mit der diese zu den verschiedenen Themenclustern passen.

Jeder Artikel inklusive Scorewerte wird im Workflow-Tool von DIZ/SZ Archiv dargestellt. Der Lektor bestätigt die Vorschläge, die zum Artikel passen oder sucht ggf. nach anderen Clustern. Die Cluster-Vorschläge des Klassifikators beschleunigen und vereinfachen die Arbeitsprozesse für die Lektoren des DIZ Die Recherchearbeiten werden mit einem Visualisierungstool unterstützt. Es werden die Themencluster als Wissensnetz dargestellt, das die Parent-Child-Beziehungen der Inhalte zeigt (siehe Grafik). "Diese Prozessoptimierung erleichtert die tägliche Arbeit unserer Mitarbeiter in entscheidendem Maße. Vor allem die automatische Vorauswahl und dadurch die schnelle Zuordnung vereinfachen den Archivierungsprozess. Die Software bietet eine hohe Qualität und Zuverlässigkeit bei der Zuordnung von Texten zu Themenclustern", bestätigt Hella Schmitt, Geschäftsführerin des DIZ München GmbH, die Vorteile der neuen Lösung.





"Wir standen hier vor der spannenden Herausforderung, eine Vielzahl an täglich neuen Artikeln einer noch größeren Anzahl an Clustern zuzuordnen. Besonders wichtig war für uns, via Mashine-Learning den hohen Ansprüchen des DIZ und dessen Premiumkunden an die Qualität der automatisch erzeugten Ergebnisse zu entsprechen. Zudem musste der Prozess für die Mitarbeiter des DIZ einfach nachvollziehbar sein und die Ergebnisse übersichtlich visualisiert werden", erklärt Alexander Siebert, Computerlinguist und CEO von Retresco. "Das gemeinsame Projekt mit dem DIZ nutzt Retrescos Semantik für die Klassifizierung von Texten in einem herausfordernden Big Data Umfeld und hebt die Arbeit mit dem Archiv damit auf ein höheres Level. Dieses Projekt ist ein wegweisendes Beispiel für die gelungene Automatisierung im Verlagswesen", so Siebert weiter.

Weiterführende Informationen unter: www.retresco.de.

Weitere Infos zu dieser Pressemeldung:

Themen in dieser Pressemitteilung:


Unternehmensinformation / Kurzprofil:

U?ber Retresco
Retresco ist Experte und Partner fu?r Semantik und die Automatisierung contentgetriebener Gescha?ftsmodelle. Auf Basis moderner Open-Source-Suchtechnologien und semantischer Verfahren entwickeln wir hochleistungsfa?hige Lo?sungen und automatisieren die effektive Verwertung von Inhalten entlang der gesamten Wertscho?pfungskette. Unsere Lo?sungen erho?hen das User Engagement und die Relevanz in Suchmaschinen, optimieren Produktionsprozesse und steigern die Umsa?tze unserer Kunden.
Zu diesen za?hlen unter anderem United Internet, N24, FAZ.net, Rheinische Post Digital, Augsburger Allgemeine, Axel Springer SE, BU?NDNIS 90/DIE GRU?NEN und das Bundesministerium fu?r Gesundheit.



PresseKontakt / Agentur:

Agentur Frische Fische
Marlen Zielke
Schlesische Straße 28
10997 Berlin
mz(at)frische-fische.com
+49 (0)30 629011-72
http://frische-fische.de/



drucken  als PDF  an Freund senden  Parallels knackt Millionenmarke bei virtuellen Containern Die Reise zur wahren Customer Journey am Beispiel der Touristik
Bereitgestellt von Benutzer: Adenion
Datum: 07.11.2014 - 09:00 Uhr
Sprache: Deutsch
News-ID 1132144
Anzahl Zeichen: 3349

Kontakt-Informationen:
Ansprechpartner: Johannes Sommer
Stadt:

Berlin


Telefon: +49 (0)30 609839605

Kategorie:

Sonstiges



Diese Pressemitteilung wurde bisher 0 mal aufgerufen.


Die Pressemitteilung mit dem Titel:
"Mehr Qualität durch semantische Analyse: Retresco entwickelt neue Software für das Archiv der Süddeutschen Zeitung"
steht unter der journalistisch-redaktionellen Verantwortung von

Retresco (Nachricht senden)

Beachten Sie bitte die weiteren Informationen zum Haftungsauschluß (gemäß TMG - TeleMedianGesetz) und dem Datenschutz (gemäß der DSGVO).

Retresco holt bmp als Finanzpartner an Bord ...

- Frisches Kapital für zügigen Geschäftsausbau - Erweiterung der Produktsparte und Ausbau des Teams in Planung Die Berliner Retresco GmbH, Spezialist für Semantische Suche, Informationsextraktion und Echtzeit-Aggregation von Inhalten, holt sich ...

CeBIT 2012: Retresco sprichtüber Content-Targeting ...

Retresco, Spezialist für Semantische Suche, Informationsextraktion und Echtzeit-Aggregation von Inhalten, wird 2012 erstmals auch auf der CeBIT zu finden sein. Gründer und Geschäftsführer Alexander Siebert diskutiert am 6. März gemeinsam mit Ma ...

Alle Meldungen von Retresco