Moduł Lingua::EN::Sentence
Uniwersytet Gdański - Instytut Matematyki - Zakład Informatyki - Strona domowaSpis treści
O czym to jest
Lingua::EN::Sentence moduł robi to samo co Text::Sentence, rozbija tekst na zdania, tylko jest lepszy :).
Metody
get_sentences($text) - po podaniu tekstu jako argumentu metody, rozbija go ona na zdania.
add_acronyms( @acronyms ) - dodaje akronimy, które będą od teraz rozpoznawalne przez get_sentences
get_acronyms() - zwróci listę akronimów już istniejących
set_acronyms( @acronyms ) - zastąpi stara listę akronimów, nową
Przykłady
use Text::Sentence qw(get_sentences add_acronyms);
add_acronyms('np'); # teraz "np." nie będzie traktowane jako koniec zdania.
$text = "To jest np. Pierwsze zdanie. Czy to jest drugie zdanie? Trzecie zdanie, i nadal trzecie!";
@zdania = get_sentences($text);
print "@zdania";
Rezultat
#To jest np. Pierwsze zdanie.
#Czy to jest drugie zdanie?
#Trzecie zdanie, i nadal trzecie!
Narazie wszystko wygląda jak w Text::Sentence? Nie. Różnica jest taka, że metoda get_sentences zwraca uwagę na akronimy,
w których kropka niekoniecznie oznacza koniec zdania. Co umożliwi poprawne rozbicie zdań typu:
"Lubię filmy akcji np. Rambo, Rocky. Jakieś inne zdanie". Moduł jest stworzony dla języka angielskiego (jest też dla
niemieckiego - Lingua::DE::Sentence), czyli niezbędne będzie dodanie polskich skrótowców.
Autor modułu
Shlomo Yona shlomo@cs.haifa.ac.il
Gdzie na Cpan'ie: http://search.cpan.org/~shlomoy/Lingua-EN-Sentence-0.25/lib/Lingua/EN/Sentence.pm
Autor opracowania
Autor: L.L.
Email: llisak@manta.univ.gda.pl