Szkoła doktorska Politechniki Warszawskiej

Wyszukiwarka promotorów i obszarów badawczych

Wykaz obszarów badawczych związanych z tagiem Large-Language-Models:

# Obszar badawczy Dziedzina naukowa
1 Wykorzystanie technologii informacyjnych do proaktywnej detekcji (identyfikowania i wykrywania) treści dezinformacyjnych i misinformacyjnych - zautomatyzowane metody flagowania treści dezinformacyjnych, śledzenia kanałów propagacji, wykrywania oryginalnych źródeł rozprzestrzeniania się fałszywych informacji. Interesują mnie przede wszystkim projekty umożliwiające połączenie nauk inżynieryjnych z naukami społecznymi w zakresie zapobiegania i zwalczania dezinformacji, m.in. przez zastosowanie metod Generative Adversarial Networks i Large Language Models, w powiązaniu z analizą psychospołeczną problemu. Ważna jest dla mnie orientacja tematu na kwestie związane z wpływem dezinformacji na sytuacje kryzysowe, amplifikację nastrojów społecznych, manipulację opinią publiczną (kryzysy zdrowia publicznego, katastrofy naturalne, działania wojenne wykorzystujące metody asymetryczne i hybrydowe).
2

Dominującym obecnie podejściem do uczenia się reprezentacji jest wstępne trenowanie dużych modeli bazowych na ogromnych statycznych zbiorach danych, co kontrastuje ze stale zmieniającym się i poszerzającym się charakterem danych dostępnych w Internecie. Proponowane badania dotyczą nowego paradygmatu, w którym zbiór danych uczących jest konstruowany ad-hoc poprzez bieżące przeszukiwanie Internetu, umożliwiając efektywne dostosowanie modeli do wybranych zadań docelowych. Celem proponowanego projektu jest między innymi: 1) zaprojektowanie metod poszukiwania odpowiednich danych uczących w Internecie i wykorzystanie ich do ustawicznej adaptacji modelu, 2) przeprowadzenie badan dotyczących konstrukcji metod samonadzorowanych (ang. self-supervised), które dla zadanego problemu: a) samodzielnie definiują metodę jego rozwiązania, b) przeszukują Internet w celu znalezienie odpowiednich danych uczących oraz c) wykorzystują znalezione dane do iteracyjnej optymalizacji modelu.

3

Abstrakcyjne rozumowanie wizualne (ang. Abstract Visual Reasoning - AVR) obejmuje problemy przypominające te pojawiające się w testach IQ. Przykładowo, Progresywne Matryce Ravena przedstawiają zestaw obrazów ułożonych w siatkę 3x3 z brakującym panelem w prawym-dolnym rogu. Zdający musi odkryć zależności rządzące znajdującymi się na obrazach kształtami 2D (i ich atrybutami), aby z zadanego zestawu opcji wybrać odpowiedź, która najlepiej uzupełnia macierz. Ogólnie rzecz biorąc, zadania AVR dotyczą podstawowych funkcji poznawczych, takich jak tworzenie analogii, abstrahowanie pojęciowe czy ekstrapolacja, co sprawia, że postępy osiągnięte w wyniku tych badań mają zastosowanie w różnych obszarach, istotnie wykraczających poza rozważane zadania. W ramach proponowanych badań planujemy zweryfikować możliwości wykorzystania wielkich modeli językowych (LLM) i wielkich modeli wizyjnych (LVM) do rozwiązywania zadań AVR, zarówno syntetycznych jak i wykorzystujących obrazy świata rzeczywistego.