Wykaz obszarów badawczych związanych z tagiem Wielkie-modele-językowe:
# | Obszar badawczy | Dziedzina naukowa |
---|---|---|
1 |
Dominującym obecnie podejściem do uczenia się reprezentacji jest wstępne trenowanie dużych modeli bazowych na ogromnych statycznych zbiorach danych, co kontrastuje ze stale zmieniającym się i poszerzającym się charakterem danych dostępnych w Internecie. Proponowane badania dotyczą nowego paradygmatu, w którym zbiór danych uczących jest konstruowany ad-hoc poprzez bieżące przeszukiwanie Internetu, umożliwiając efektywne dostosowanie modeli do wybranych zadań docelowych. Celem proponowanego projektu jest między innymi: 1) zaprojektowanie metod poszukiwania odpowiednich danych uczących w Internecie i wykorzystanie ich do ustawicznej adaptacji modelu, 2) przeprowadzenie badan dotyczących konstrukcji metod samonadzorowanych (ang. self-supervised), które dla zadanego problemu: a) samodzielnie definiują metodę jego rozwiązania, b) przeszukują Internet w celu znalezienie odpowiednich danych uczących oraz c) wykorzystują znalezione dane do iteracyjnej optymalizacji modelu.
|
|
2 |
Abstrakcyjne rozumowanie wizualne (ang. Abstract Visual Reasoning - AVR) obejmuje problemy przypominające te pojawiające się w testach IQ. Przykładowo, Progresywne Matryce Ravena przedstawiają zestaw obrazów ułożonych w siatkę 3x3 z brakującym panelem w prawym-dolnym rogu. Zdający musi odkryć zależności rządzące znajdującymi się na obrazach kształtami 2D (i ich atrybutami), aby z zadanego zestawu opcji wybrać odpowiedź, która najlepiej uzupełnia macierz. Ogólnie rzecz biorąc, zadania AVR dotyczą podstawowych funkcji poznawczych, takich jak tworzenie analogii, abstrahowanie pojęciowe czy ekstrapolacja, co sprawia, że postępy osiągnięte w wyniku tych badań mają zastosowanie w różnych obszarach, istotnie wykraczających poza rozważane zadania. W ramach proponowanych badań planujemy zweryfikować możliwości wykorzystania wielkich modeli językowych (LLM) i wielkich modeli wizyjnych (LVM) do rozwiązywania zadań AVR, zarówno syntetycznych jak i wykorzystujących obrazy świata rzeczywistego.
|