Skip to content

romek-rozen/siteFocusOllama

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

SiteFocus Tool 🎯

Narzędzie do analizy spójności tematycznej stron internetowych wykorzystujące embeddingi tekstu.

🌟 Funkcje

  • Analiza spójności tematycznej stron internetowych
  • Wsparcie dla wielu dostawców embeddingów (Ollama, OpenAI, Jina)
  • Automatyczne crawlowanie stron z sitemap
  • Inteligentne czyszczenie treści (usuwanie menu, stopek, reklam)
  • Wizualizacja wyników
  • Cache dla crawlowanych stron i embeddingów

📋 Wymagania

  • Python 3.8+
  • Ollama (opcjonalnie dla lokalnych embeddingów)
  • Klucz API OpenAI (opcjonalnie)
  • Klucz API Jina (opcjonalnie)

🚀 Instalacja

  1. Sklonuj repozytorium:
git clone https://github.com/username/sitefocus.git
cd sitefocus
  1. Zainstaluj wymagane pakiety:
pip install -r requirements.txt
  1. (Opcjonalnie) Zainstaluj i uruchom Ollamę:

🎮 Użycie

  1. Uruchom aplikację:
streamlit run app.py
  1. Wybierz dostawcę embeddingów (Ollama/OpenAI/Jina)
  2. Wprowadź URL referencyjny (opcjonalnie)
  3. Wprowadź listę domen do analizy
  4. Kliknij START

📊 Metryki

  • Site Focus Score - Miara spójności tematycznej (0-100%)
    • <30% - Niska spójność
    • 30-60% - Średnia spójność
    • 60% - Wysoka spójność

🔧 Konfiguracja

  • Ollama: Domyślnie http://localhost:11434/
  • OpenAI: Wymaga klucza API
  • Jina: Wymaga klucza API

📝 Licencja

MIT License

👥 Autorzy

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages