Duplikate finden

Begonnen von Heino-Fan, 18. Juli 2013, 15:56:24

Vorheriges Thema - Nächstes Thema

Heino-Fan

Hallo!
Gibt es ein Plugin für foobar, mit dem man Duplikate finden kann?
Ich kenne diesesn Thread http://foobar-users.de/index.php?topic=1365.0
Aber der ist ja nun schon nicht mehr ganz aktuell.

Am liebsten wäre es mir, wenn Duplikate anhand identischer Tags gefunden werden.

Oder gibt es etwa einen String, für eine automatische Playlist, die alle doppelten Einträge anzeigt?

VG und danke
HF

Roncolins

#1
 :coolsmiley:
Ich stand vor dem gleiche Problem und hatte beim Suchen auch nichts gefunden.
Für mich habe ich das Problem recht elegant gelöst, auch wenn die Beschreibung gleich etwas komplex scheint.
Wenn die Tools erstmal eingerichtet sind geht alles in Sekunden.

Ergebnis
Man erlangt die Möglichkeit nach Duplikaten gruppierte Playlists zu erstellen, wobei die Kriterien für die Duplikat-Selektion selbst festgelegt werden können


1a. Duplikate identifizieren
- Nutzung des UI Facets http://www.foobar2000.org/components/view/foo_facets
- Über eine Auswahl-Kaskade bekomme ich die Anzahl der Dateien pro Titel (Selektionskriterien Columne für Columne bitte selbst festlegen)
- für meine Kaskade habe ich folgende Columns definiert
Columne 1 = "LW" für Laufwerksbuchstabe = $left(%path%,1)
Columne 2 = "Ordner" für Ordnername = %directoryname%
Columne 3 = "Stück" für Künstler & Titel = %artist% - %title%
(so kann ich einzelne Ordner oder Laufwerke z.B. USB-Stick zum Vergleichen auswählen)
- in jeder Columne unter "statistic" = "Items" auswählen
- jetzt bitte meinen Nachtrag im nächsten Beitrag beachten
1b. Fortsetzung zu: Duplikate identifizieren
- in der letzten Facet-Spalte sortiere ich nach der Anzahl pro Titel durch Klick auf den "Item"-Spaltenkopf
- alle Titel mit der Anzahl "1" (keine Duplikate) markiere ich am besten mit Maus und Shift-Taste (Anfang und Ende der Auswahl)
- mit ENTF-Taste alle Einzelstücke löschen
- übrig bleiben nun nur noch die Mehrfachstücke

2. Duplikate für die Bearbeitung in Playlist übernehmen
- in der Playlistanzeige (UI Playlist View) für die eingefügten Duplikate habe ich ebenfalls die Spaltendefinition und die Gruppierungsdefinition entsprechend meinen "Duplikats-Kriterien" eingerichtet (also Columne "Stück" = %artist% - %title% und Gruppe "Stück" = %artist% - %title%)
- Dann die Liste sortieren nach dieser Spalte "Stück" und Gruppieren nach "Stück"


Wer anders selektieren will kann sich selbst was zusammenbasteln. Mögliche Felder und Syntax für die Selektion findet man hier:
http://wiki.hydrogenaudio.org/index.php?title=Foobar2000:Title_Formatting_Reference

Roncolins

#2
Noch ein Nachtrag für das Auswerten von Ordnern, Laufwerken, USB-Sticks, welche nicht in der Mediendatenbank (Media Library) sind:

Nachdem alles wie nach Schritt 1a (in meinem vorherigen Beitrag) eingerichtet ist, geht man wie folgt vor:
- In der Laufwerksspalte oder in der Ordnerspalte von Facets alles markieren, was man aus der Mediendatenbank auswerten möchte.
- jetzt werden alle Titel daraus in einer Playlist angezeigt
- eine leere Playlist einrichten und alle selektierten Titel hinüberkopieren
- nun in diese gleiche Playlist die externen Laufwerke oder Ordner ziehen, die noch zusätzlich ausgewertet werden sollen (Ordner per drag & drop aus dem Windows-Explorer in die Playlist ziehen, z.B. des USB-Stick oder den MP3-Player
- jetzt werden auch die Titel angezeigt, die nicht in der Mediendatenbank sind
- Das Wahlfeld von Facets (oben links im UI) von "Library" auf "Playlist" umschalten
- jetzt werden in der Laufwerksspalte oder in der Ordnerspalte auch die Quellen angezeigt, die nicht in der überwachten Mediendatenbank sind, sondern eben nur für diesen einen Zweck hinzugefügt wurden.

Nun geht's mit Schritt 1b weiter

AldiMp3

Stark vereinfacht liegt ein Duplikat schon vor, wenn die Column '%artist% - %title%' mehr als ein Item (Ergebnis) hat.  Da jedes Musikstück '%artist% - %title%' aber auf unterschiedlichen Alben sein kann, bedarf es der Überlegung, ob es nur einmal oder mehrfach (z.B. Codec MP3,FLAC...) vorgehalten werden soll. Aber selbst bei gleichem Codec z.B. MP3 gibt es weitere Überlegungen:

1. Beispiel: 001. Benjamin Blümchen - Benjamin Blümchen Lied.mp3 hat deutlich mehr als 100 Items, aber eben auch Alben. Jedes Album wird mit diesem Lied eröffnet. Die Lieder sind tatsächlich identisch und könnten bei Platzmangel ohne Hörkontrolle gelöscht werden, dann wären alle Alben aber nur noch unvollständig in der Sammlung ;-)

2. Beispiel: Paul Anka – Diana.mp3 hat auch extrem viele Items. Diese unterscheiden sich aber nicht nur in der Disc- und Track-Nr., sondern auch in der Duration, die von wenigen Sekunden bis über 4 Minuten reicht. Es hilft wenig, einfach zu unterstellen das gleiche Duration immer bedeuten würde, das ein identisches Musikstück vorliegen müßte. Auf dem Album 'Schellackstars Vol.2' klingt das Stück mit Duration 2:30 natürlich ganz anders, als auf dem Album 'THEN 1957'. Es ist also entscheidend, aus welcher Originalquelle die digitale Kopie stammt. Ohne Durchhören könnte man sehr viele seltene Perlen automatisch versenken.

3. Beispiel: Kelly Clarkson - Stronger (What Doesn't Kill You).mp3 scheint schon eine ziemlich lange und exakte Bezeichnung zu sein, aber es gibt auch bei diesem Musikstück viele Versionen, die nicht immer richtig mit %Subtitle% oder Remix bezeichnet sind. Konkret sind zu unterschieden:
7th Heaven Radio Mix, Genetix Remix, Futurecop! Club Remix, Project 46 Remix, Hotline's Miami Vice Club Remix, Nicky Romero Club Remix, Promise Land Remix, Papercha$er Remix
7th Heaven Club Mix...

4. Beispiel: Grateful Dead - China Cat Sunflower.mp3 gibt es nicht nur auf dem Album 'Aoxomoxoa' aus dem Jahre 1969, sondern auch remastert, mono, stereo und in über 20 Live-Versionen. Selbst der Zusatz 'live at Fillmore' wäre ungenau, denn es gab zwischen 1969 und 1971 gleich 3 Konzerte dort. Jeder Musikdienst bzw. jede Musikquelle hat unterschiedliche Tags, so daß selbst identische Stücke nicht immer die gleichen Tags aufweisen...

Fazit: Bestenfalls könnte man mit Facets einiges klug vorsortieren und in die engere Wahl für vermeintliche Duplikate nehmen. Hier würde ich aber eher bei %album artist% - %album% - %date% - [%tracknumber%. ]%title% ansetzen. Erst wenn diese kombinierten Felder in einer Column alle übereinstimmen, könnte sich zuverlässiger ein Stück als Duplikat finden lassen. Am Ende sollte man sich aber die Stücke doch besser kurz anhören und erst dann beerdigen. Das Anhören könnte auch zusätzliche kostenpflichtige Software wie z.B. der Audio Comparer von Bolide Software übernehmen. Aber auch hier sollte erst kostenlos getestet werden, denn das Thema Duplikate ist komplex und ob alle persönlichen Belange durch eine Softwarelösung wirklich abgedeckt werden, kann nur jeder für sich beantworten.

Roncolins

#4
Ja klar, es kommt immer darauf an, welchen Zweck man verfolgt und welche Ordnung oder Unordung man hat. Beispielsweise pflege ich viele Daten gar nicht wie "Album", "Date", "Track".

Die Sortierkriterien muss wohl jeder nach belieben ausprobieren.
Facets ermöglicht immerhin das Zählen von Dateien mit gleichen Kritierien und somit das Erstellen einer Playlist mit kritieriengleichen Dubletten aus verschiedenen Ordnern oder Laufwerken (z.B. MP3-Player).

Da man sich in der Playlist ja auch den Pfad der Datei anzeigen lassen kann, kann man hieraus schon erste Schlußfolgerungen ziehen und Entscheidungen treffen. Mit einem einfachen "ENTFERNEN" nimmt man diese dann aus der Playlist wieder raus.

Und dann wird man wohl mal reinhören müssen  :-\ und sich für den/die Favoriten entscheiden.