Facebook Google+ Twitter

Czyżby nadszedł kres literówek i „ortów”?

Filip Kwiatkowski, współautor infobota, student UMCS w Lublinie do swojej pracy magisterskiej zatytułowanej „Automatyczna korekcja błędów w tekście pisanym" napisał genialny program, dzięki któremu być może w przyszłości Sieć stanie się wolna od literówek i błędów ortograficznych.

Program Automatyczna Korekcja Błędów być może zrobi wielką furorę w komputerowym świecie. / Fot. screenAutomatyczna korekcja błędów – bo właśnie taką dumną nazwę nosi ten program – jest programem, który eliminuje i poprawia pojawiające się w tekście wielorakie błędy. Mimo tego, że w Sieci dostępne są jedynie trailery przedstawiające możliwości programu, to on już i tak spotkał się z wielkim zachwytem wśród internautów.

Podstawą edytorów tekstu, z których zwykliśmy korzystać, jest szybka ale mało wyrafinowana metoda bazująca na liście najczęściej popełnianych literówek. Program Filipa Kwiatkowskiego opiera się na liście poprawnych słów w danym języku. W przypadku, gdy słowo wpisane przez użytkownika nie jest rozpoznawane przez program, to szuka on słowa najbardziej podobnego do tego, które wpisaliśmy.

- Skorzystałem tu z kilku algorytmów do wyznaczania odległości edycyjnej między słowami. Dodatkowo, program bierze pod uwagę odległości między klawiszami na klawiaturze. Przykładowo, jeśli napiszemy "bayon", wśród propozycji poprawnych słów znajdą się między innymi "baton" oraz "baron". Na klawiaturze najbliżej litery y znajduje się jednak litera t, w związku z czym za bardziej prawdopodobne zostanie uznane słowo "baton" – dla Wiadomości24.pl mówi Filip Kwiatkowski.

- Program daje sobie radę z dużą ilością błędów (nie tylko z literówkami, ale również z błędami ortograficznymi), ale oczywiście nie ze wszystkimi. Przykładowo program nie będzie wiedział, czy wyraz "drętwr" zamienić na "drętwe" czy "drętwę", jako że oba będą równie prawdopodobne. W przyszłości można by w takich przypadkach brać pod uwagę kontekst zdania.

Historia programu

Wszystko to zaczęło się od Infobota. Filip Kwiatkowski opracował podobny mechanizm poprawiania błędów do Infobota – bota informacyjnego, którego rozwija wspólnie ze swoim kolegą.

W trakcie rozwijania infobotowego mechanizmu Filip Kwiatkowski doszedł do wniosku, że takie wykrywanie i poprawianie błędów mogłoby ciekawie wyglądać w edytorze tekstu. Po rozmowie ze swoim promotorem, obaj doszli do wniosku, że jest to ciekawy temat na pracę magisterską. Ot i wszystko się zaczęło.

Praca nad programem przeplatana była pisaniem pracy magisterskiej. Łącznie zajęło to około kilu miesięcy, choć jak przyznaje oort - bo pod takim pseudonimem występuje w Sieci - napisanie samego programu zajęło mu kilka tygodni.

W trakcie prac nad programem pojawiały się nowe pomysły dotyczące aplikacji, które autor na bieżąco implementował.

Piski zachwytu…

Oort na bieżąco zamieszczał w Sieci relacje z prac nad infobotem. Filmik przedstawiający możliwości programu zamieszczony w serwisie YouTube osiągnął 41223 wejścia, zaś w serwisie Wykop został wykopany przez 521 wykopowiczów.

Pod jego notkami na blogu, filmikiem na YouTube, oraz na Wykopie stale pojawiają się nowe wpisy. Ich autorzy pytają kiedy program będzie dostępny w Sieci, na jakiej licencji będzie udostępniony, czy zostanie stworzona wtyczka do FireFoxa i komunikatorów, albo czy zostanie on wcielony do jakiegoś edytora tekstu.

Autor sam jeszcze nie wie co zrobi z programem. Chciałby go przekazać szerokiemu gremium użytkowników komputera na jakieś wolnej licencji. Wg niego bardzo prawdopodobne jest stworzenie wtyczki do FireFoxa. Co do komunikatorów byłoby to ciężkie, ponieważ musiałby nawiązać współpracę z ich twórcami, choć przyznaje, że byłoby to bardzo przydatne rozwiązanie. Decyzję o wykorzystaniu programu niestety musi odłożyć na później, ponieważ teraz jest zbyt zajęty aby o tym myśleć.

Należy mieć na uwadze, że program w formie, w której obecnie działa jest „zasobożerny”, ponieważ po uruchomieniu zajmuje prawie 300 MB pamięci operacyjnej.

Poczekamy, zobaczymy. Autorowi życzymy powodzenia i jak najszybszego podjęcia decyzji.

Specjalne pozdrowienia dla czytelników Wiadomości24.pl, napisane w programie przez Filipa Kwiatkowskiego:





***OD AUTORA***
Pisząc ten tekst, stwierdziłem, że program bardzo by i mi się przydał, ponieważ pisząc teraz w Wordzie non stop widzę czerwone podkreślenia… Ja i moje nieodłączne literówki :)

Wybrane dla Ciebie:




Komentarze (4):

Sortuj komentarze:

@dargrze
"Zasobożerność na poziomie 300 MB pamięci RAM sugeruje, że autorzy nie zrobili żadnych optymalizacji wydajnościowych." - nie autorzy a autor. Program został napisany na potrzeby magisterki. Autor dopiero zaczyna myśłeć o udostępnieniu go i optymalizacji działania.
Tekst nie miał niczego reklamować! Celem tego tekstu było przedstawienie programu, który być mozę w przyszłośći poprawi komunikację w sieci. A niby dlaczego zadziałał odwrotnie?

Komentarz został ukrytyrozwiń

,,Co do komunikatorów byłoby to ciężkie, ponieważ musiałby nawiązać współpracę z ich twórcami''. A może dobrze, by zainteresował się XMPP na początek? Zarówno klienty jak i protokół mają otwartą specyfikację. Nie trzeba błagać twórców, by się zgodzili kiwnąć palcem.
Druga sprawa. Z artykułu wywnioskowałem, że największą zaletą programu jest jego automagiczność. Pozostałe cechy mają już inne programy (zgoda, niekoniecznie otwarte). Automatyzacja zaś, w przypadku skomplikowanej gramatyki i stylistyki języka polskiego, to kwestia nadal wysoce dyskusyjna, bo żaden program nie zagwarantuje 100% bezbłędności poprawionego tekstu. Jak dla mnie, oznacza to kłopoty jeszcze większe niż dotychczas.
Zasobożerność na poziomie 300 MB pamięci RAM sugeruje, że autorzy nie zrobili żadnych optymalizacji wydajnościowych. Jedynym światełkiem w tunelu jest pomysł korekt kontekstowych, ale to, jak czytam, jest melodia przyszłości.
Wniosek: tekst, który miał zareklamować otwarty pomysł (bo przecież nie produkt!), jak dla mnie zadział zupełnie odwrotnie. Szkoda.

Komentarz został ukrytyrozwiń

@tosiek
taaak zawsze reklamuję produkty niedostępne na rynku, przecież o to chodzi, aby reklamować coś co jest ogólnie niedostępne... ehh... Oczywiście zdanie: "Filmik przedstawiający możliwości programu zamieszczony w serwisie YouTube osiągnął 41223 wejścia, zaś w serwisie Wykop został wykopany przez 521 wykopowiczów." - jest istnym pianiem z zachwytu....
Jeśli to nic nowego to podaj nazwę podobnego programu, majacego podobne możliwości.
Oczywiśćie w szkole nauczymy się unikać literówek, oczywiście...

Komentarz został ukrytyrozwiń
  • Autor usunął profil
  • 06.10.2008 23:58

artykuł brzmi bardziej jak reklama produktu niż rzetelna ocena. Autor pieje z zachwytu że na youtube oglądano go 40 tys razy (jak na youtube jest to mało bowiem popularne filmy mają oglądalność kilkumilionową).
Sam program nie jest niczym nowym i nie oferuje nic nowego. Zamiast chwalić automat co poprawia - lepiej nauczyć się poprawnego pisania w szkole.

Komentarz został ukrytyrozwiń

Jeśli chcesz dodawać komentarze, musisz się zalogować.

Najpopularniejsze

Copyright 2017 Wiadomosci24.pl

Korzystamy z cookies i local storage.

Bez zmiany ustawień pliki są zapisywane na urządzeniu. Więcej przeczytasz tutaj.