diff --git a/README.MD b/README.MD
index 5304ab3..88b6780 100644
--- a/README.MD
+++ b/README.MD
@@ -1,4 +1,11 @@
-## Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (2020, RAG)
+
+
+ * [Unsupervised Dense Information Retrieval with Contrastive Learning (2021, Contriever)](#unsupervised-dense-information-retrieval-with-contrastive-learning-2021-contriever)
+ * [Precise Zero-Shot Dense Retrieval without Relevance Labels (2022, HyDE)](#precise-zero-shot-dense-retrieval-without-relevance-labels-2022-hyde)
+ * [Query2doc: Query Expansion with Large Language Models (2023, Better HyDE)](#query2doc-query-expansion-with-large-language-models-2023-better-hyde)
+ * [Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents (2023)](#is-chatgpt-good-at-search-investigating-large-language-models-as-re-ranking-agents-2023)
+
+
---
## Unsupervised Dense Information Retrieval with Contrastive Learning (2021, Contriever)
@@ -14,7 +21,7 @@
В архитектуре запросы и документы кодируются независимо, а скалярное произведение используется для оценки релевантности. В качестве энкодера используется один трансформер (в данной статье - BERT).
-### Constractive learning
+
Constractive learning

@@ -23,7 +30,8 @@
Функция потерь дает высокие оценки положительным парам и низкие оценки отрицательным. Другими словами, идея состоит в том, чтобы восстановить или извлечь все положительные документы среди всех отрицательных на основе запроса. Теперь вопрос в том, как выбирать положительные и отрицательные пары?
-### Стратегия выбора положительных пар
+
+ Стратегия выбора положительных пар
1. Inverse cloze task - стратегия аугментации данных для генерации двух непересекающихся представлений документа. Первое представление - это выборка токенов из текста. Второе - дополнение первого представления (то есть оставшиеся токены, что не попали в выборку на первом шаге). ICT использует первое представление в качестве запроса и дополнение в качестве ключа.
@@ -34,7 +42,8 @@
3. Замена слов, удаление и т.д.
-### Стратегия выбора отрицательных пар
+
+ Стратегия выбора отрицательных
1. Внутри одного батча - использование одних и тех же ключей в одном батче. Однако для эффективности требуются чрезвычайно большие размеры батчей.
@@ -62,3 +71,72 @@
**Ищем похожий документ:** Ожидается, что эмбеддер также выступает в роли компрессора, позволяющего отфильтровывать галлюцинации. Реальные документы сравниваются с полученным вектором, и извлекаются наиболее похожие из них. В качестве эмбеддера используется Contriever.

+
+---
+
+## Query2doc: Query Expansion with Large Language Models (2023, Better HyDE)
+
+Метод для zero-shot retrieval с использованием псевдодокументов. Несмотря на то, что идея частично заимствована у HyDE, этот подход можно использовать как для dense, так и sparse retrieval.
+
+**Метод**
+
+Для запроса _q_ используется подход с несколькими примерами, при котором выбирается k _(k = 4)_ пар из обучающего набора. Затем формируется новый запрос путем конкатенации исходного запроса и псевдодокумента _d_.
+
+
+
+
+**Sparse retrieval**
+
+
+Поскольку запрос, обычно, короче документа, его сбалансированность достигается путем повторения запроса n раз перед конкатенацией.
+
+
+
+
+**Dense retrieval**
+
+
+Новый запрос представляет собой конкатенацию исходного запроса и документа без повторений.
+
+
+
+
+
+
+
+---
+
+## Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents (2023)
+
+Большинство методов в значительной степени зависят от ручных сигналов, которые требуют человека для разметки и демонстрируют слабую обобщаемость. Могут ли современные LLM превзойти настроенные модели в условиях zero-shot в задаче ранжирования? (Спойлер: могут)
+
+
+
+**Метод**
+
+Каждый фрагмент текста обозначается уникальным идентификатором ([1], [2] и т. д.). Мы просим LLM сгенерировать перестановку фрагментов в порядке убывания их релевантности к запросу в формате [2] > [3] > [1] > и т. д. (c на рисунке)
+
+
+
+
+**Скользящее окно**
+
+Из-за ограничений на количество токенов в LLM, предлагается использовать скользящее окно. В зависимости от размеров окна и шага LLM переранжирует фрагменты текста поочередно.
+
+
+
+
+
+
+
+**Дистилляция знаний**
+
+ChatGPT и GPT-4 дорогостоящи в использовании в коммерческих поисковых системах и в том числе могут увеличить задержку. Мы можем дистиллировать способности ChatGPT в маленькую модель.
+
+Для достижения этого из MS MARCO выбираются 10 000 запросов с 20 кандидатными фрагментами, полученными с помощью BM-25 для каждого запроса. В качестве функции потерь рассматривается потеря RankNet.
+
+
+
+_ri_ - ранг фрагмента, _si_ - оценка релевантности.
+
+
diff --git a/images/query2doc_dense.png b/images/query2doc_dense.png
new file mode 100644
index 0000000..d8637a5
Binary files /dev/null and b/images/query2doc_dense.png differ
diff --git a/images/query2doc_metrics.png b/images/query2doc_metrics.png
new file mode 100644
index 0000000..fc82ca6
Binary files /dev/null and b/images/query2doc_metrics.png differ
diff --git a/images/query2doc_model_comparison.png b/images/query2doc_model_comparison.png
new file mode 100644
index 0000000..fefd578
Binary files /dev/null and b/images/query2doc_model_comparison.png differ
diff --git a/images/query2doc_prompt.png b/images/query2doc_prompt.png
new file mode 100644
index 0000000..f34b242
Binary files /dev/null and b/images/query2doc_prompt.png differ
diff --git a/images/query2doc_sparse.png b/images/query2doc_sparse.png
new file mode 100644
index 0000000..de67268
Binary files /dev/null and b/images/query2doc_sparse.png differ
diff --git a/images/rankgpt_distill_comparison.png b/images/rankgpt_distill_comparison.png
new file mode 100644
index 0000000..ef2186d
Binary files /dev/null and b/images/rankgpt_distill_comparison.png differ
diff --git a/images/rankgpt_loss.png b/images/rankgpt_loss.png
new file mode 100644
index 0000000..de8a0dc
Binary files /dev/null and b/images/rankgpt_loss.png differ
diff --git a/images/rankgpt_metrics.png b/images/rankgpt_metrics.png
new file mode 100644
index 0000000..8355797
Binary files /dev/null and b/images/rankgpt_metrics.png differ
diff --git a/images/rankgpt_metrics_small.png b/images/rankgpt_metrics_small.png
new file mode 100644
index 0000000..687cec4
Binary files /dev/null and b/images/rankgpt_metrics_small.png differ
diff --git a/images/rankgpt_model_comparison.png b/images/rankgpt_model_comparison.png
new file mode 100644
index 0000000..e2fd408
Binary files /dev/null and b/images/rankgpt_model_comparison.png differ
diff --git a/images/rankgpt_prompt.png b/images/rankgpt_prompt.png
new file mode 100644
index 0000000..00696fc
Binary files /dev/null and b/images/rankgpt_prompt.png differ
diff --git a/images/rankgpt_sliding_window.png b/images/rankgpt_sliding_window.png
new file mode 100644
index 0000000..5f1463f
Binary files /dev/null and b/images/rankgpt_sliding_window.png differ
diff --git a/img.png b/img.png
new file mode 100644
index 0000000..e2fd408
Binary files /dev/null and b/img.png differ