Moduł Lingua::EN::Sentence

Uniwersytet Gdański - Instytut Matematyki - Zakład Informatyki - Strona domowa

O czym to jest

Lingua::EN::Sentence moduł robi to samo co Text::Sentence, rozbija tekst na zdania, tylko jest lepszy :).

Metody

get_sentences($text) - po podaniu tekstu jako argumentu metody, rozbija go ona na zdania.

add_acronyms( @acronyms ) - dodaje akronimy, które będą od teraz rozpoznawalne przez get_sentences

get_acronyms() - zwróci listę akronimów już istniejących

set_acronyms( @acronyms ) - zastąpi stara listę akronimów, nową

Przykłady

use Text::Sentence qw(get_sentences add_acronyms); add_acronyms('np'); # teraz "np." nie będzie traktowane jako koniec zdania. $text = "To jest np. Pierwsze zdanie. Czy to jest drugie zdanie? Trzecie zdanie, i nadal trzecie!"; @zdania = get_sentences($text);

print "@zdania";

Rezultat

#To jest np. Pierwsze zdanie.

#Czy to jest drugie zdanie?

#Trzecie zdanie, i nadal trzecie!

Narazie wszystko wygląda jak w Text::Sentence? Nie. Różnica jest taka, że metoda get_sentences zwraca uwagę na akronimy,

w których kropka niekoniecznie oznacza koniec zdania. Co umożliwi poprawne rozbicie zdań typu:

"Lubię filmy akcji np. Rambo, Rocky. Jakieś inne zdanie". Moduł jest stworzony dla języka angielskiego (jest też dla

niemieckiego - Lingua::DE::Sentence), czyli niezbędne będzie dodanie polskich skrótowców.

Autor modułu

Shlomo Yona shlomo@cs.haifa.ac.il

Gdzie na Cpan'ie: http://search.cpan.org/~shlomoy/Lingua-EN-Sentence-0.25/lib/Lingua/EN/Sentence.pm

Autor opracowania

Autor: L.L.

Email: llisak@manta.univ.gda.pl

Uniwersytet Gdański - Instytut Matematyki - Zakład Informatyki - Strona domowa - Perl - Wyklady
[c] Piotr Arłukowicz, materiały z tej strony udostępnione są na licencji GNU.