Stworzył terminal Linux wspierany przez AI. Jak działa?

19 kwietnia 2021 Szymon Lewandowski

Asystenci w smartfonach to już codzienność. Ale co powiecie na asystenta w linux-owym terminalu? Takie rozwiązanie zaprezentował właściciel kanału River’s Educational Channel. Wykorzystał prosty pythonowy shell oraz OpenAI.

Siri, Cortana, Alexa, Asystent Google? Phi! Co powiecie na prywatnego, terminalowego asystenta? Wykorzystując naprawdę niewielką ilość kodu oraz dostęp do API OpenAI, można bez większych problemów stworzyć AI. Zbuduje ono za Ciebie shellowe komendy na podstawie twoich wymagań.

Jak to w ogóle działa?

Całość opiera się na bardzo prostym formacie pytań i odpowiedzi, jednego z kilku sposobów na komunikowanie się z modelami GPT, udostępnionymi przez OpenAI. Shell rejestruje wpisywane zapytanie, przesyła je w formie HTTP requesta do API, a tam zostaje wygenerowane i przesłane polecenie, gotowe do wykonania.

Autor musiał dostarczyć odpowiedni “przykładowy kontekst”, wraz z przykładami danych wejściowych i wyjściowych. Dzięki nim model mógł łatwo opracować gotowe rozwiązania. Jako kontekstu użył “Polecenie bash Linuksa do wykonania zadań”. Do tego dołożył 5 przykładów, nieco więcej niż zalecane optymalnie 2 lub 3 przykłady. Użycie takiej „bazy” przykładów pozwoliło na uzyskanie naprawdę dokładnych odpowiedzi. Niestety wiąże się to z większym kosztem każdego zapytania.

OpenAI przykłady zapytań Tak wyglądają przykłady, wykorzystane przez River’s Educational Channel

Co potrafi taki asystent?

Na chwilę obecną AI pozwala na generowanie komend z wykorzystaniem podstawowych narzędzi uniksowych. Niestety przy bardziej “ambitnych” zapytaniach OpenAI nie potrafi sobie dać rady. Modelowi nie udało się wygenerować obrazu z trzema żyrafami, nie udało mu się także poradzić z podstawowymi zadaniami wykonywanymi przy przetwarzaniu danych.

OpenAI klucz API dla River's Educational Channel Obecnie każda osoba chcąca przetestować możliwości OpenAI musi ubiegać się o dostęp do API, do tego konieczny jest specjalny klucz. Właśnie taki (co ciekawe, w wersji fizycznej) dostał River’s Educational Channel.

Warto także podkreślić, że na ten moment nie jesteśmy w stanie po prostu pobrać asystenta i korzystać z niego na własnym komputerze. Model cenowy OpenAI oraz stan rozwoju tego oprogramowania (wczesna beta) sprawiają, że wykorzystanie klucza API River’s Educational Channel mogłoby się skończyć szybkim zapchaniem kolejki requestów oraz sporymi kosztami. Pocieszające jest jednak to, że podobne rozwiązanie można spróbować zaimplementować samodzielnie. Teoretycznie wystarczy skonfigurować lokalnie działający model GPT-2.

Ciekawe, czy dałoby się przez shella zamówić jedzenie z dowozem.

Zdjęcie główne artykułu pochodzi z OpenAI. Źródło: River’s Educational Channel