Skip to content

Fabbernat/-ARCHIVE-Peternity

Repository files navigation

Scroll down for English description!

Peternity konzolos és webalkalmazás

Ennek a konzolos és web alkalmazásnak a feladata, hogy megvizsgálja, hogy a WiC (word in context) feladatot különböző nyelvi modellek mennyire jól tudják megoldani, illetve, hogy mennyire érzékenyek esetlegesen arra, hogyha a 2 példamondatot, amire vonatkozóan döntést kell hozzanak, azt fordított sorrendben adjuk be nekik. Az alkalmazás tartalmaz egy szkriptet is, amely képes a legtöbb magyar szót helyesen elválasztani. A modul kifejezetten a magyar elválasztási szabályok figyelembevételével készült.

Megvizsgált algoritmusok és modellek terv szerint:

  • gemma2-2b és ennek pár-- a pontosság rovására kisebb méretűvé tett --variánsa.
  • GPT-Neo: A GPT-3 egy nyílt forráskódú változata.
  • OPT: A Facebook által fejlesztett nagy nyelvi modell.
  • BLOOM: A BigScience projekt által fejlesztett többnyelvű LLM.
  • ... és még amire idő jut.

Linkek

A cél, hogy az alkalmazásban a modelleknek alábbi formájú kérdéseket lehessen feltenni:

A és B mondatban ugyanazt jelenti-e az X szó?

Lehetséges platformok erre:

Magyar nyelvű magyarázó videó hozzá:

https://www.inf.u-szeged.hu/~rfarkas/NLP/ - 5. hét - Jelentésegyértelműsítés

LLM-k benchmarkjainak összehasonlítása:

TESZTELÉS:

  • Check Large Language Model (LLM) API Playground by Retool

English version:

Peternity console and web app

The task of this console and web application is to examine how well different language models can solve the WiC (word in context) task, and how sensitive they might be to the fact that the 2 example sentences for which a decision has to be made are given in reverse order in for them. The app also has a script that can hyphenate most Hungarian words correctly. The module is specifically designed for Hungarian hyphenation rules.

According to the plan, tested models will be:

  • gemma2-2b and its variants - reduced in size at the expense of accuracy, GPT 3.5 and 4, Gemini,
  • GPT-Neo
  • OPT
  • BLOOM
  • and some more as much as time will allow.

Links

The goal is to be able to ask the models the following questions in the application:

Does the word X mean the same thing in sentences A and B? Answer with a single "YES" or "NO". Possible platforms to do this:

Hungarian explanatory video:

https://www.inf.u-szeged.hu/~rfarkas/NLP/ – Week 5 – Word Sense Disambiguation

Compare benchmarks of LLM's:

TESTING:

  • Check Large Language Model (LLM) API Playground by Retool

About

Flask-alapú webalkalmazás, amely megvizsgálja, hogy a word-in-context feladatot különböző nyelvi modellek mennyire jól tudják megoldani, illetve, hogy mennyire érzékenyek arra, hogyha a 2 mondatot, amelyre döntést kell hozzanak, fordítva adjuk be. A Hugging Face transformers könyvtárát használja a modellek betöltésére és predikciók készítésére

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors