UnifiedQA ist ein Frage-Antwort-System, das die Fähigkeit besitzt, verschiedene Frage-Antwort-Formate zu verarbeiten, ohne auf ein bestimmtes Format spezialisiert zu sein. Dieses System wurde entwickelt, um die künstliche Trennung zwischen verschiedenen Frage-Antwort-Formaten zu überwinden und eine einheitliche Lösung für alle Frage-Antwort-Aufgaben anzubieten.
Die Frage-Antwort-Aufgaben werden in verschiedenen Formaten präsentiert, wie z.B. extraktive Span-Auswahl, Multiple-Choice-Fragen usw. Dies hat zu format-spezifischen Modellen geführt, die jeweils auf ein bestimmtes Format ausgerichtet sind. UnifiedQA argumentiert, dass diese Trennung künstlich ist und dass die Fähigkeiten, die wir lehren möchten, nicht von dem Format abhängen.
UnifiedQA verwendet die neuesten Fortschritte in der Sprachmodellierung, um ein einziges vortrainiertes Frage-Antwort-Modell zu erstellen, das auf 17 Frage-Antwort-Datensätzen mit 4 verschiedenen Formaten trainiert wurde. Das System performt auf demselben Niveau wie 9 verschiedene Modelle, die jeweils auf einzelnen Datensätzen trainiert wurden. Selbst bei 12 unbekannten Datensätzen von bekannten Formaten performt UnifiedQA überraschend gut, was eine starke Generalisierung von seinem Ausbildungsdatenmaterial zeigt.
UnifiedQA kann leicht in PyTorch/HuggingFace geladen werden, anstatt die Modelle manuell herunterzuladen. Die Modelle sind auf der HuggingFace-Modell-Hub-Seite aufgeführt. Es gibt verschiedene Modelle in verschiedenen Größen, wie z.B. small, base, large, 3B und 11B.
Hier sind einige Beispiele, wie UnifiedQA verwendet werden kann:
```python from transformers import T5Tokenizer, T5ForConditionalGeneration
model_name = "allenai/unifiedqa-t5-small" # Sie können die Modellgröße hier angeben tokenizer = T5Tokenizer.from_pretrained(model_name) model = T5ForConditionalGeneration.from_pretrained(model_name)
def run_model(input_string, generator_args): input_ids = tokenizer.encode(input_string, return_tensors="pt") res = model.generate(input_ids, generator_args) return tokenizer.batch_decode(res, skip_special_tokens=True)
run_model("Which is the best conductor? \n (a) iron (b) feather")
run_model("Scott filled a tray with juice and put it in a freezer. The next day, Scott opened the freezer. How did the juice most likely change? \n (a) it condensed. (b) it evaporated. (c) it became a gas. (d) it became a solid.") ```
UnifiedQA ist ein mächtiges Frage-Antwort-System, das die Fähigkeit besitzt, verschiedene Frage-Antwort-Formate zu verarbeiten, ohne auf ein bestimmtes Format spezialisiert zu sein. Es bietet eine einheitliche Lösung für alle Frage-Antwort-Aufgaben und performt auf demselben Niveau wie format-spezifische Modelle.
* KI-Zusammenfassungen können Fehler enthalten. Alle Angaben ohne Gewähr.