Apertium
Apertium | |
Информация | |
---|---|
Последна версия | 3.1.1 |
Програмен език | C++ |
Операционна система | POSIX съвместима |
Език на интерфейса | Многоезичен |
Вид софтуер | Машинен превод |
Лиценз | GNU General Public License |
Уебсайт | www.apertium.org |
Apertium в Общомедия |
Apertium е платформа за автоматично превеждане, разработвана от испанското правителство и правителството на Каталуния в университета на Аликанте. Apertium е свободен софтуер и се разпространява под условията на ГНУ лиценза.
История
[редактиране | редактиране на кода]Apertium възниква като един от двигателите за машинен превод в проекта OpenTrad, който е бил спонсориран от Испанското правителство. Първоначално е бил проектиран да превежда между близки езици, въпреки че бива разширен да обработва повече различни езикови двойки. За да се създаде нова система за машинен превод, просто трябва да се разработят езикови данни (речници, правила) в добре формулирани XML формати.
Рзработените езикови данни за него (в сътрудничество с Universidade de Vigo, Universitat Politècnica de Catalunya и Universitat Pompeu Fabra) за момента поддържат (в стабилна версия) езиците Астуриански, Баски, Бретонски, Български, Каталонски, Датски, Английски, Есперанто, Френски, Галисийски, Исландски, Македонски, Норвежки (Букмол и Съвременен), Окситански, Португалски, Румънски, Испански, Шведски и Уелски. Пълен списък е наличен по-долу. Няколко фирми са също ангажирани с разработването на Apertium, включително Prompsit Language Engineering, Imaxin Software и Eleka Ingeniaritza Linguistikoa.
Apertium е повърхностно-трансферна система за машинен превод, която използва датчик за определени състояния за всичките си лексикални преобразувания и скрит модел на Марков за маркиране част на говора или пояснение на категорията думи. Маркировчици за ограничена граматика също се използват за някои езикови двойки (например. Бретонски-Френски).
Проектът е участвал през 2009 г. и 2010 г. в изданията на Google Summer of Code и през 2010 г. в изданието на Google Code-in.[1]
Езикови двойки
[редактиране | редактиране на кода]Списък на текущите стабилни езикови двойки:
ast | eu | br | bg | ca | da | en | eo | fr | gl | is | mk | nb | nn | oc | pt | ro | es | cy | sv | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Астуриански | — | (⇄) | ||||||||||||||||||
Баски | — | (→) | ||||||||||||||||||
Бретонски | — | (→) | ||||||||||||||||||
Български | — | (⇄) | ||||||||||||||||||
Каталонски | — | (⇄) | (←) | (⇄) | (⇄) | (⇄) | (⇄) | |||||||||||||
Датски | — | (←) | ||||||||||||||||||
Английски | (⇄) | — | (⇄) | (⇄) | (←) | (←) | (⇄) | (←) | ||||||||||||
Есперанто | (←) | (⇄) | — | (←) | ||||||||||||||||
Френски | (←) | (⇄) | — | (⇄) | ||||||||||||||||
Галисийски | (⇄) | — | (⇄) | (⇄) | ||||||||||||||||
Исландски | (→) | — | ||||||||||||||||||
Македонски | (⇄) | (→) | — | |||||||||||||||||
Норвежки (Букмол) | — | (⇄) | ||||||||||||||||||
Норвежки (Съвременен) | (⇄) | — | ||||||||||||||||||
Окситански | (⇄) | — | (⇄) | |||||||||||||||||
Португалски | (⇄) | (⇄) | — | (⇄) | ||||||||||||||||
Румънски | — | (←) | ||||||||||||||||||
Испански | (⇄) | (←) | (⇄) | (⇄) | (⇄) | (⇄) | (⇄) | (⇄) | (←) | — | ||||||||||
Уелски | (→) | — | ||||||||||||||||||
Шведски | (→) | — |
Вижте също
[редактиране | редактиране на кода]Позовавания
[редактиране | редактиране на кода]- Corbí-Bellot, M. et al. (2005) An open-source shallow-transfer machine translation engine for the romance languages of Spain in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79 – 86
- Armentano-Oller, C. et al. (2006) Open-source Portuguese-Spanish machine translation in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50 – 59.
- ↑ Google Summer of Code page, архив на оригинала от 16 март 2011, https://web.archive.org/web/20110316102540/http://socghop.appspot.com/, посетен на 27 ноември 2010