Auf der Konferenz SISAP 2022 an der Universität Bologna wurde Lars Lenssen mit dem "best student paper award" ausgezeichnet für den Beitrag "Lars Lenssen, Erich Schubert. Clustering by Direct Optimization of the Medoid Silhouette. In: Similarity Search and Applications. SISAP 2022.
Der Springer-Verlag unterstützt diese Konferenz, und stellt ein Preisgeld für diese Auszeichnung. Die besten Beiträge der Konferenz werden zudem eingeladen, eine erweiterte Fassung für ein Special Issue des A*-Journals "Information Systems" einzureichen.
In diesem Artikel wird ein Clusteringverfahren vorgestellt, dass direkt die Medoid Silhouette optimiert, eine Variante des populären Qualitätsmaßes Silhouette; dabei ist das neue Verfahren aber O(k²) Mal schneller ist als bisherige Vorschläge. Dadurch können nun viel größere Datenmengen mit diesem Ansatz geclustert werden, den gerade bei großem k ist das neue Verfahren um Größenordnungen schneller und effizienter als bisherige Ansätze. Die Implementierung ist verfügbar im Rust "kmedoids" crate sowie dem Python-Paket "kmedoids", der Quellcode ist als Open Source auf Github.
Bereits 2020 war die Arbeitsgruppe bei dieser Auszeichnung erfolgreich, damals vertreten durch Erik Thordsen mit dem Beitrag "Erik Thordsen, Erich Schubert. ABID: Angle Based Intrinsic Dimensionality. In: Similarity Search and Applications. SISAP 2020. https://doi.org/10.1007/978-3-030-60936-8_17".
In diesem Beitrag wurde eine neuartige winkel-basierte Schätzung der lokalen intrinsischen Dimensionalität (einem Maß für die lokale Komplexität von Daten) vorgestellt hat, für das bisher normalerweise distanzbasierte Ansätze verwendet werden.