An Introduction to Duplicate Detection - Infos zum Artikel - Preisvergleich
Produkt Optional: Preisspanne von bis Euro

Einverständniserklärung zu Cookies, Daten- und Trackinginformationen
Wir verwenden Cookies, um Inhalte und Anzeigen zu personalisieren. Beim Besuch dieser Webseite werden Informationen gespeichert. Bei der Darstellung von Produkten werden Bilder von an anderen Webseiten geladen. Um das zu ermöglichen, ist es nötig, dass ihr Browser Verbindungen zu anderen Servern aufbaut und dorthin Daten überträgt. Die Verarbeitung der an Kostenscout.de gesendeten Daten erfolgt zur Leistungserbringung, zu statistischen sowie werbetechnischen Zwecken. Wenn Sie auf der Seite weitersurfen, stimmen Sie der Cookie-Nutzung und Datenverarbeitung zu. Datenschutzinformationen ansehen

An Introduction to Duplicate Detection

With the ever increasing volume of data, data quality problems abound. Multiple, yet different representations of the same real-world objects in data, duplicates, are one of the most intriguing data quality problems. The effects of such duplicates are detrimental; for instance, bank customers can obtain duplicate identities, inventory levels are monitored incorrectly, catalogs are mailed multiple times to the same household, etc. Automatically detecting duplicates is difficult: First, duplicate representations are usually not identical but slightly differ in their values. Second, in principle all pairs of records should be compared, which is infeasible for large volumes of data. This lecture examines closely the two main components to overcome these difficulties: (i) Similarity measures are used to automatically identify duplicates when comparing two records. Well-chosen similarity measures improve the effectiveness of duplicate detection. (ii) Algorithms are developed to perform on very large volumes of data in search for duplicates. Well-ed algorithms improve the efficiency of duplicate detection. Finally, we discuss methods to evaluate the success of duplicate detection. Table of Contents: Data Cleansing: Introduction and Motivation / Problem Definition / Similarity Functions / Duplicate Detection Algorithms / Evaluating Detection Success / Conclusion and Outlook / Bibliography von Naumann, Felix;Herschel, Melanie;

Anbieter: Studibuch Shop DE
ab 2.23 Euro*
(zzgl. 0.00* Euro Versand)
Stand:05.05.2024
Preis kann jetzt höher sein

Die bei uns gelisteten Preise basieren auf Angaben der gelisteten Händler zum Zeitpunkt unserer Datenabfrage. Diese erfolgt einmal täglich. Von diesem Zeitpunkt bis jetzt können sich die Preise bei den einzelnen Händlern jedoch geändert haben. Bitte prüfen sie auf der Zielseite die endgültigen Preise. Die Sortierung auf unserer Seite erfolgt nach dem besten Preis oder nach bester Relevanz für Suchbegriffe (je nach Auswahl).
Für manche Artikel bekommen wir beim Kauf über die verlinkte Seite eine Provision gezahlt. Ob es eine Provision gibt und wie hoch diese ausfällt, hat keinen Einfluß auf die Suchergebnisse oder deren Sortierung. Unser Preisvergleich listet nicht alle Onlineshops. Möglicherweise gibt es auf anderen bei uns nicht gelisteten Shops günstigere Preise oder eine andere Auswahl an Angeboten.
Versandkosten sind in den angezeigten Preisen und der Sortierung nicht inkludiert.


Livesuche | Über uns | Datenschutz | Shop eintragen | Impressum

* - Angaben ohne Gewähr. Preise und Versandkosten können sich zwischenzeitlich geändert haben.
Bitte prüfen sie vor dem Kauf auf der jeweiligen Seite, ob die Preise sowie Versandkosten noch aktuell sind.