Skip to content

Latest commit

 

History

History
48 lines (37 loc) · 2.17 KB

README.md

File metadata and controls

48 lines (37 loc) · 2.17 KB

DHBW_BERTopic

Einleitung

Im Zuge des Moduls "Neue Konzepte" an der DHBW Lörrach im Studiengang Informatik (TIF18A) soll das ML-Modell Bertopic optimiert werden. Hierzu sollen Knowledge-Graphen (KGE) verwendet werden, um das Topic Modelling zu verbessern.

Im ersten Schritt soll ein lauffähiges Bert erarbeitet werden, während im zweiten Schritt verschiedene Knowledge Graphen integriert werden. Im dritten Schritt soll BERT schließlich mit dem entsprechenden KGE zusammenarbeiten und in einer Verbesserung des Topic Modellings resultieren.

Einrichtung der Anaconda Environment auf Windows

Dokumentation zur Verwendung von Conda Environments von conda.io
Manuelles Erstellen der Environment:

  • Vorraussetzung: Microsoft C++ Build Tools sollte installiert sein, Python komplett deinstallieren
  • Anaconda herunterladen
  • mit Anaconda ein Environment aufsetzen - conda create --name myenv
  • Environment aktivieren - conda activate myenv
  • pip installieren - conda install pip
  • Packages und BERT installieren - pip install pytorch-transformers pytorch-nlp protobuf bertopic
  • conda install -c anaconda tk

Erstellen der Environment mit dem .yml File:

  • bertopic38.yml vom Repository downloaden
  • Conda Prompt öffen
  • Zur .yml Datei navigieren
  • Environment erstellen - conda env create -f bert39nonvisual.yml

Einrichtung ohne Anaconda auf Mac/Linux

Version Python 3.7.1 oder höher benötigt.

$ brew install bertopic

Verwendung und Ausführung des Beispiel-Codes

  • Pfad zur python.exe eines Environemts in der Conda Prompt:
  • activate myenv
  • where python
  • In der IDE den Interpreter ändern und die von conda angezeigte python.exe auswählen.
  • Die Datei "test_code.py" in der IDE ausführen

Sammlung der Models

Vanilla Model https://drive.google.com/drive/u/0/folders/1yLuXdentikQGQ0KJ_iNTOmShsxomchJI

Multilingual Model (Das sollte genommen werden) https://drive.google.com/drive/u/0/folders/1yLuXdentikQGQ0KJ_iNTOmShsxomchJI

Bert Model einbinden

model = BERTopic.load("models/MODEL")