Narzędzie do analizy spójności tematycznej stron internetowych wykorzystujące embeddingi tekstu.
- Analiza spójności tematycznej stron internetowych
- Wsparcie dla wielu dostawców embeddingów (Ollama, OpenAI, Jina)
- Automatyczne crawlowanie stron z sitemap
- Inteligentne czyszczenie treści (usuwanie menu, stopek, reklam)
- Wizualizacja wyników
- Cache dla crawlowanych stron i embeddingów
- Python 3.8+
- Ollama (opcjonalnie dla lokalnych embeddingów)
- Klucz API OpenAI (opcjonalnie)
- Klucz API Jina (opcjonalnie)
- Sklonuj repozytorium:
git clone https://github.com/username/sitefocus.git
cd sitefocus
- Zainstaluj wymagane pakiety:
pip install -r requirements.txt
- (Opcjonalnie) Zainstaluj i uruchom Ollamę:
- Uruchom aplikację:
streamlit run app.py
- Wybierz dostawcę embeddingów (Ollama/OpenAI/Jina)
- Wprowadź URL referencyjny (opcjonalnie)
- Wprowadź listę domen do analizy
- Kliknij START
- Site Focus Score - Miara spójności tematycznej (0-100%)
- <30% - Niska spójność
- 30-60% - Średnia spójność
-
60% - Wysoka spójność
- Ollama: Domyślnie
http://localhost:11434/
- OpenAI: Wymaga klucza API
- Jina: Wymaga klucza API
MIT License