LanguageTool

Скриншот программы:
LanguageTool
Детали программы:
Версия: 2.9 обновление
Дата загрузки: 14 Apr 15
Разработчик: Daniel Naber
Тип распространения: Бесплатная
Популярность: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool является открытая программа источник корректура предназначена для поиска ошибок, которые штатными средствами проверки орфографии не может обнаружить. Это правило на основе стиля и проверки грамматики, которая найдет ошибки, для которых правило, определенные в конфигурационных файлах XML, такие как смешение и ldquo; их & Rdquo; с & ldquo;. & там Rdquo;


Обнаруживает различные проблемы грамматики

Программа может также обнаружить различные проблемы грамматики и поставляется с поддержкой более 20 языков, включая английский, немецкий, польский, французский, испанский, шведский, греческий, китайский, датский, японский, исландский, португальский и бразильский португальский.
Кроме того, он может похвастаться простой в использовании, простой и понятный графический пользовательский интерфейс, который позволяет любому, чтобы вставить текст, который должен быть заклинание проверил. Это можно проверить текст в буфере обмена, текстового тега, вырезать / копировать / вставлять текст, и проживать в системном трее.


Обнаруживает широкий спектр проблем

В диалоговом окне Параметры, вы можете включить какой тип проблем приложение может обнаружить, в том числе плохой стиль, грамматические ошибки, сленг, пунктуационных ошибок, возможных опечаток, избыточных фраз, часто путают слова, словосочетания, капитализации, семантики, а также а нестандартные фразы.


LanguageTool для LibreOffice и OpenOffice

Помимо того, отдельное приложение, LanguageTool также доступна в качестве расширения для двух наиболее популярных и мощных офисных пакетов с открытым исходным кодом, LibreOffice и OpenOffice.org Apache, что позволяет пользователям корректировать свои тексты, щелкнув правой кнопкой на выбранных фраз или пункты.


LanguageTool для Mozilla Firefox

Кроме того, приложение также доступно для скачивания в качестве дополнения к миру и Rsquo; самый популярный с открытым исходным кодом веб-браузер в мире, Mozilla Firefox. Она не требует перезагрузки и помещает маленькую кнопку на главной панели инструментов, что позволяет корректировать выделенный текст из веб-сайтов или форм.


Под капотом и наличие

Приложение написано полностью на языке программирования Java, который означает, что он и Rsquo; са программа кросс-платформенный, предназначен для работы с любым дистрибутивом GNU / Linux, а также BSD, Solaris, Microsoft Windows и Mac OS X операционной Системы, где установлен Java Runtime Environment.

Что нового В этом выпуске:

  • Каталонский:
  • обновляются POS словарь тег
  • добавлены новые правила
  • фиксированные ложные тревоги
  • Английский
  • Добавлена ​​несколько правил и фиксированные несколько ложных тревог
  • Добавлена ​​много правил новый стиль предоставлены Хейкки Lehvaslaiho. Как они могут привести к ложным срабатываниям, они не активируется по умолчанию. Вы можете активировать их, поворачивая на всех правил в новой «Plain English" категории.
  • Эсперанто:
  • добавили несколько новых правил
  • Французский
  • обновляются POS словарь и словарь тег Hunspell в Dicollecte-5.3
  • Немецкий:
  • добавили несколько новых правил и основных ложных тревог
  • Добавлена ​​новая правило, которое проверяет договорённости глагола. В настоящее время, только случаи с 'ист', 'Синд', 'войны', и '' Варен поддерживаются. Пример ошибок, обнаруженных: ". Der Hund Синд ща и пара; п ',' Die Авто ист Шнель. Для того, чтобы это правило работу, фразы теперь объединены в disambiguation.xml: например, «Манн» в фразе «Ein Mann 'только сохранить свою именительном чтение (SUB: NOM: SIN: MAS), в то время как он использовал, чтобы иметь также винительный и дательный показания (SUB: АКК: SIN: MAS, SUB: DAT: SIN: MAS). (https://github.com/languagetool-org/languagetool/issues/233)
  • итальянский
  • улучшилось несколько правил
  • польский:
  • добавил несколько новых правил
  • португальский
  • добавленные / улучшенные несколько правил
  • 3695 составные слова (дореформенных) - крупнейший бесплатная база данных
  • Русский:
  • Добавлена, и улучшена правила
  • украинское:
  • большой словарь обновление
  • новые правила грамматики
  • новый простой замены правила для мягких предложений
  • улучшения disambiguator
  • соединение пометки и орфографические улучшения

  • улучшения
  • инициалы пометки
  • приговор и слово улучшения tokenizing
  • Улучшена обработка символа СоМа и мягкой дефис
  • Правила Bitext:
  • добавил простое правило для проверки того переводов заканчиваются же знак препинания, как и оригинальная (это включает в себя только.?! символов).
  • теперь можно добавлять внешние файлы правил bitext в командной строке, с помощью
  • -bitextrule вариант. Путь к файлу должен быть абсолютным. Примечание:. Это позволяет использовать bitext правила также для языков, которые не имеют никаких правил bitext включенные по умолчанию
  • Правописание:
  • Новые файлы на /hunspell/spelling.txt может быть использован для добавления принятые слова в орфографический, которые также учитывать при создании предложения для ошибками слов. Это похоже на /hunspell/ignore.txt файлов, которые приняты список слов, которые * не * используемые при создании предложения для ошибками слов.
  • API
  • JLanguageTool.activateDefaultPatternRules () и JLanguageTool.activateDefaultFalseFriendRules () были удалены - все шаблонные правила и правила ложно друг (если второй язык указан) теперь включается автоматически, когда конструктор JLanguageTool называется. Если вам нужен проверки без шаблонных правил XML на основе расширить языковой класс (например, «английский») с тем, который переписывает getPatternRules () метод и возвращает пустой список есть.
  • ManualTagger.lookup () был заменен ManualTagger.tag () после того, устаревшим, начиная с последней версии
  • Все статические методы и поля из класса «язык» были перемещены к новому классу «языки». В настоящее время, методы / поля в классе языка все еще существуют, но устарел.
  • LanguageIdentifierTools был удален. Использование LanguageIdentifier вместо этого.
  • Удалено (по умолчанию) ResourceDataBroker.setResourceDir () и setRulesDir (), как это может быть установлено с помощью конструктора
  • Подчищены до класса Автор, например, удаление getRemark ()
  • Category.setDefaultOff () был удален, это может быть установлен с помощью конструктора в настоящее время
  • Переименование классов: o.lt.rules.patterns.Element = & GT; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & GT; o.lt.rules.patterns.PatternTokenMatcher
  • Другие мелкие уборок API, которые не должны влиять на общие случаи использования, например, IncorrectExample.getCorrections () возвращается и нередактируемым список сейчас, удаление устаревших методов.
  • встроенный сервер:
  • XML-экранирование было зафиксировано, это может привести к неверные XML документы должны быть возвращены
  • Новая опция конфигурационного файла 'maxWorkQueueSize ", что позволяет установить максимальный размер очереди запросов - если он получает больше, чем это, запросы будут отклонены (503 Сервис недоступен)
  • Теперь сервер отвечает с более конкретными кодов состояния HTTP в этих условиях об ошибке: 413 Request Entity Too Large - если текст превышает максимальный размер текста 503 Служба недоступна - если проверка превышает максимальное время проверки
  • GUI:
  • Автономный интерфейс теперь можно взять обычный текстовый файл в качестве аргумента, это файл будет загружен на старте (Github вопрос # 232).
  • Командная строка:
  • Теперь можно добавить внешний файл правил при вызове LanguageTool из командной строки. Используйте --rulefile добавить файл. Если имя файла имеет формат, который содержит имя языка, он будет использоваться наряду с другими правилами; в противном случае, это будет заменить правила. Вы также можете загрузить внешний файл с ложными друзьями, используя опцию --falsefriends. Имя файла должно быть абсолютный путь файла, и ложные файлы друг всегда добавляются к тем, которые загружаются для языка. (Github выпуск # 192)
  • Синтаксис Правило:
  • Правило может теперь один пример предложения, как долго, как это имеет атрибут '' коррекции - это может спасти некоторую избыточность, если только правильное предложение такое же, как в предложении неправильного с коррекцией применяется. До правило нужна, по крайней мере два примера приговоры.
  • "пример" элемент: тип = "неправильное" теперь необязательно, если есть атрибут "коррекция". Атрибут 'Коррекция' означает, что приговор является неправильным.
  • "пример" элемент: тип = "правильно" теперь необязательно. Нет атрибут «тип» и атрибут «коррекция» не означает, что приговор является правильным.
  • Внутренняя:
  • Мы перешли от Apache Тика в языке-детектора (https://github.com/optimaize/language-detector~~HEAD=pobj) для автоматического определения языка текста. Она должна быть быстрее и результаты должны быть более надежным. Обнаружение Астурийский и галисийский должен быть отключен, так как качество обнаружения составил слишком низкий, а также пострадавших обнаружение испанском языке.
  • Исправлена ​​регрессия, которая сделала невозможным для загрузки внешних файлов правил в GUI.

Что нового в версии 2.8:

  • Городской:
  • удалить зависимость от Hunspell, теперь использует Morfologik для проверки правописания
  • Бретон:
  • добавлены и усовершенствованы несколько правил
  • Каталонский:
  • Обновленный словарь
  • Добавлена, и улучшена правила
  • фиксированные ложные тревоги
  • Голландский:
  • Добавлена, и улучшена много правил
  • Английский
  • некоторые новые правила (спасибо Ник Хью)
  • обновил Tagger и синтезатор словари, фиксирующие выпуск # 202
  • Новый фильтр будет использоваться для сопоставления partofspeech частей слов, например:. в * Это будет только держать матчи для слов, которые начинаются с 'в' и где часть после того, как «в» является прилагательным (POS тег "JJ"). "Нет: 1 'не является маркер позиции, то есть здесь первый (и единственный) соответствия называют
  • .
  • Французский
  • добавлены и усовершенствованы несколько правил
  • Немецкий:
  • добавлены и усовершенствованы несколько правил
  • польский:
  • Добавлена, и улучшена несколько правил
  • добавлены и усовершенствованы ложные друзья с английского
  • португальский
  • добавленные / улучшенные несколько правил
  • Испанский:
  • удалить зависимость от Hunspell, теперь использует Morfologik для проверки правописания
  • переформатирован файл правила
  • Добавлены правила
  • тагальский:
  • удалить зависимость от Hunspell, теперь использует Morfologik для проверки правописания
  • тире символов ("") является разделителем теперь, когда tokenizing текст
  • Русский:
  • Добавлена, и улучшена правила
  • добавил несколько правил ложные друзья переводчика (русский / английский)
  • украинское:
  • много новых правил (в том числе соглашения с существительными, время выражений и т.д.)
  • Улучшение охвата правило
  • Обновление словаря (большие улучшения для имен собственных и звательном случае)
  • новый тег и правила, чтобы предупредить об альтернативных правописания
  • добавлена ​​информация частота слова, чтобы улучшить правописание предложения
  • некоторые новые правила disambiguator
  • Правило Синтаксис:
  • ... теперь могут быть добавлены в rulegroup затрагивает все правила этой группы
  • Если вы разрабатываете свои собственные правила, которые не являются частью LT теперь вы можете добавить внешний = "да" к вашим категориям, чтобы предотвратить ссылку правила для community.languagetool.org появляться в нашем автономном GUI (ссылка не будет работать правил, которые не являются частью основного распределения LT). (Github выпуск # 223)
  • Если группа правил определяет по умолчанию = "выключить", правила внутри группы правил не может также указать значение по умолчанию = "на" / "OFF".
  • API
  • Удалены классы и методы, которые были устаревшие, так как 2.7 или более
  • встроенный сервер:
  • опции, конфигурационный файл "requestLimit 'и' 'requestLimitPeriodInSeconds теперь также могут быть использованы для сервера HTTP (не только для сервера HTTPS)
  • Новая опция конфигурационного файла 'trustXForwardForHeader ": установить это' истинный ', если вы запустите сервер за обратного прокси-сервера и хотите предел запрос на работу на оригинальных IP-адресов, предоставляемых HTTP заголовка' Xforwardedfor ', как правило, устанавливается прокси. Если вы запустите через прокси-сервер, но не установить это свойство верно, один пользователь может использовать все запросы, так что другие пользователи также получают сообщение об ошибке из-за лимита запроса.
  • Исправлена ​​реакция После режиме Deadline: ... иногда пустой, путая текст чек в WordPress
  • Правила Bitext не были отключены должным образом, даже если они были указаны при правильном параметра для сервера; теперь это фиксированной
  • Исправлена ​​проблема с неправильной позиции для некоторых правил bitext (выпуск № 218)
  • GUI:
  • Новый параметр "errorColors" была добавлена ​​в файл конфигурации languagetool.cfg. Он может быть использован для установки цвета фона ошибок. Например, errorColors = типографская: # b8b8ff, стиль: # ffb8b8 покажет "типографские" ошибки с синем фоне и «стиль» ошибки на красном фоне в верхней части окна LT. "типографский" и "стиль" являются типы, которые установлены в grammar.xml, как "типа = ...". Там нет пользовательского интерфейса еще настроить эти цвета. Обратите внимание, что вы должны только изменить файл, когда languagetool.cfg LT не работает.
  • Внутренняя:
  • Исправление: правила внутри группы правил не было активировано, если предыдущее правило из той же rulegroup используется по умолчанию = "OFF"
  • Слова не игнорируются больше по орфографии только потому, что они происходят в предложении правило в. Если вы хотите, чтобы проверки орфографии игнорировать слова в глобальном масштабе, добавьте их в Hunspell / ignore.txt. Чтобы игнорировать их в зависимости от контекста, добавить '' ignore_spelling правило disambiguation.xml.
  • Файл "Hunspell / prohibit.txt" теперь могут быть использованы, чтобы отметить слова, как орфографических ошибок, даже если проверка орфографии, как правило, принимают их. Это полезно для улучшения орфографии LanguageTool не дожидаясь входной проверки будет обновляться. Файл 'prohibit.txt "является противоположностью" ignore.txt ", что приводит к орфографии игнорировать слова.
  • The partofspeech Tagger для большинства языков теперь могут быть расширены путем добавления записи в файл орг / LanguageTool / ресурс / ХХ / ХХ added.txt (будучи код языка). Формат "fullform BaseForm postag", три колонки, разделенных вкладок. Это делает его более удобным для пользователей (и разработчиков), чтобы продлить POS Tagger, так как они не должны экспортировать, изменять и воссоздать бинарный словарь для каждого изменения.

Что нового в версии 2.7:

  • Бретон:
  • Добавлена, и улучшена правила
  • Новое правило, которое проверяет, если день недели соответствует дате, например, обнаруживает "Gwener 28а именно Eost 2014", как дата не является пятница.
  • Каталонский:
  • Добавлена, и улучшена правила
  • фиксированные ложные тревоги
  • Голландский:
  • Добавлена, и улучшена много правил
  • перешел на Morfologik основе орфографии
  • -Английский:
  • Вы хотите, чтобы быть частью команды, которая разрабатывает самый мощный в мире Open Source корректура инструмент? Мы ищем сопровождающему для правил английского языка в LanguageTool. См http://wiki.languagetool.org/tasks-for-language-maintainers для деталей.
  • Все английские словари были расширены, чтобы содержать классы частотных слов, чтобы улучшить предложения модуля проверки правописания (данные частоты берется из https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / ИМЕС / латинские / словари, как и для других языков, которые уже используют эту функцию).
  • Лучшие предложения по изучающих английский язык: неправильных глаголов, существительных, прилагательных и в настоящее время, как правило, имеют лучшее предложение. Например, "thinked» предполагает «мысль», «Женщины» предполагает 'женщины'.
  • Другие опечатками представить предложения в настоящее время, например, "garentee" (гарантия), «благодарны» (благодарность). Это может привести к снижению производительности ~ 10% (больше для текстов с большим количеством незнакомых слов).
  • Новое правило, которое проверяет, если день недели соответствует дате, например, обнаруживает "Понедельник, 7 октября 2014", как дата не является понедельник. Это правило будет работать, только если он определяет формат даты в использовании. Пока поддерживаются следующие форматы: * "понедельнику, 7 октября 2014" * "Понедельник, 7 октябрем 2014" * "Понедельник, 7 Октябрь 2014" * "понедельник, 7 Октября 2014" * (это также работает с сокращенным недели дни, как Мо или пн на понедельник)
  • Эсперанто:
  • Новое правило, которое проверяет, если день недели соответствует дате, например, обнаруживает "Vendredon ла 28-в-де-AAgusto 2014", как дата не является пятница.
  • Французский
  • обновляются POS словарь и словарь тег Hunspell в Dicollecte-5.2
  • добавил синтезатор - правило Соглашение теперь могут сделать предложения для некоторых ошибок
  • добавленные / улучшенные несколько правил
  • Новое правило, которое проверяет, если день недели соответствует дате, например, обнаруживает "Vendredi 28/08/2014", как дата не является пятница.
  • Немецкий:
  • Исправлена ​​редкая NullPointerException и ArrayIndexOutOfBoundsException
  • Исправлены несколько ложных тревог
  • Добавлена, и улучшена правила
  • Новое правило, которое проверяет для фраз без глагола (выключен по умолчанию из-за риска ложных тревог)
  • Новое правило, которое проверяет, если день недели соответствует дате, например, обнаруживает "Dienstag, 29.9.2014", как дата не является вторник.
  • Улучшена производительность для проверки орфографии предложений
  • персидский:
  • добавил начальную поддержку для персидского языка (фарси)
  • польский:
  • добавлены и усовершенствованы некоторые правила
  • новое правило, которое проверяет, если день недели соответствует дате
  • португальский
  • добавленные / улучшенные несколько правил
  • добавлено много десятков сложных слов
  • Русский:
  • добавлены новые правила
  • исправить SourceForge запрос функция # 38 (проверка на разных кавычек)
  • добавил несколько правил ложные друзья переводчика (русский / английский)
  • новое правило, которое проверяет, если день недели соответствует дате, например, Обнаруживает "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 Н ?? & ETH; & микро; & ETH; & frac12; N & sbquo, N ?? & ETH; & plusmn; N & евро; N ?? 2 014 & ETH; & ;. sup3 ", как дата не является понедельник
  • .
  • расширены русской соединение правило с новых слов из словаря postag
  • Испанский:
  • Добавлена ​​новая категория POS Z (для прописаны чисел, например, "Uno", "душ", ...)
  • пишется число теперь могут быть обнаружены и удалось как в неоднозначности и правил.
  • Исправлены некоторые неправильные леммы в словаре POS.
  • Добавлена ​​Гибридный Chunker-disambiguator.
  • Тамил:
  • Добавлена ​​начальная поддержка тамильском для. Если шрифт для тамильского не правильно отображаться на Вашем компьютере, и вы используете Windows, вы, возможно, потребуется применить обойти описано здесь: https://bugs.openjdk.java.net/browse/JDK-8008572
  • украинское:
  • большое обновление для словаря POS (исправлений и новых слов)
  • некоторые POS тег переименован в последовательности; новые теги для сокращений и редких слов
  • много новых правил и исправления для существующих правил
  • новое правило, которое проверяет, если день недели соответствует дате, например, обнаруживает "и ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & микро; & ETH; 'N- & ETH;" & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & пункт; & ETH; & frac34; & ETH; & Sup2; 2014 ", как дата не является понедельник
  • маркер улучшение производительности нормализация
  • Интеграция LibreOffice:
  • Не пугайтесь сносок в LibreOffice 4.3 и выше (это дает нам сейчас со сноской позиций как мета-данные, чтобы мы могли их игнорировать).
  • API
  • Основные улучшения эффективности использования случае многопоточной, где JLanguageTool получает созданный в потоке, но объект язык (например, «Немецкий») получает создан только один раз. Накладные для создания JLanguageTool сейчас должно быть гораздо ниже.
  • Убраны несколько классов и методов, которые были устаревшие, начиная с версии 2.6
  • Удалено DutchSpellerRule - вместо этого использовать MorfologikDutchSpellerRule
  • Подпись Language.getRelevantRules () изменилось
  • В JLanguageTool и MultiThreadedJLanguageTool конструкторы не заявляют бросить IOException больше
  • WhitespaceRule была переименована в MultipleWhitespaceRule (WhitespaceRule еще существует, но не рекомендуется)
  • Устаревшие некоторые методы, чьи видимость будет уменьшаться (например, от общественности защищено)
  • MorfologikSpellerRule.getRuleMatch (String, Int) была переименована в MorfologikSpellerRule.getRuleMatches (String, Int)
  • Конструктор RuleMatch Теперь бросает исключение, если toPosition не больше, чем fromPosition
  • Введен новый абстрактный класс, который расширяет TextLevelRule правило, и может быть использован для правил, которые охватывают более чем одиночные предложения.
  • Командная строка:
  • Включение и отключение конкретных правил в то же время в настоящее время допускается. Для того, чтобы проверить только некоторые правила (запрет все остальное), который ранее было сделано с "--enable LIST_OF_RULES", в настоящее время использовать "--enable --enabledonly LIST_OF_RULES" (или "-eo -е LIST_OF_RULES").
  • встроенный сервер:
  • две новые опции может быть установлен в свойствах файла, чтобы вернуться LanguageTool тот же формат XML, как после крайнего срока (ATD). Таким образом, он может быть использован в качестве заменой для АтД: * режим - "LanguageTool" или "AfterTheDeadline '* afterTheDeadlineLanguage - код языка по умолчанию, если режим установлен в" AfterTheDeadline' Примечание: режим "AfterTheDeadline 'следует рассматривать Экспериментальная сейчас.
  • Новая опция '' maxCheckThreads позволяет установить максимальное количество потоков, работающих на запросы параллельно. По умолчанию 10, как это было раньше.
  • Внутренние:
  • Нью абстрактный правило AbstractDateCheckFilter, что позволяет проверить, если день недели и дату матч. Например, "Вторник, 29 сентябрь 2014" могут быть обнаружены, а 29 сентября 2014 года на самом деле не во вторник. При этом используется новый экспериментальный интерфейс RuleFilter, что можно назвать с XML с новой «фильтра» элемента. "Фильтр" принимает эти атрибуты: 'класс': полностью квалифицированное имя класса Java, который реализует RuleFilter, например "org.languagetool.rules.de.DateCheckFilter" "аргументы": строка, как "год: 1 месяц: 2 день: пн-пт 3: 4", то есть через пробел список пар ключ / значение, где х получает решил Значение маркера шаблон (как в "сообщение" элемента)
  • Правило соединение теперь игнорирует маркеры, которые были вакцинированы в disambiguation.xml
  • "Фильтр" действие в disambiguator теперь применяется только к POS тегов, которые соответствуют POS тег дали. Если они не совпадают, то правило не применяется.
  • Если вы расширяете правила XML, как описано в http://wiki.languagetool.org/tips-and-tricks#toc2, внешние правила и неоднозначности файлы теперь могут быть размещены на защищенном паролем сервере, указав URL, как это: HTTP: // пользователь: password@example.org/path/user-rules.xml
  • The тире ("а & евро;" ") в настоящее время является tokenizing характер для всех языков
  • Новая функция:
  • Использование языковых моделей
  • LanguageTool теперь могут использовать данные ngram. Данные ngram информация о том, как часто происходят фразы в языке. В настоящее время эта использует фразы длиной 3.
  • Данные используются английской правило, чтобы найти ошибки омофонном, как смешение грубой / курс или чутье / вспышка. LanguageTool были некоторые правила такого рода прежде, но новое правило теперь поддерживает около 900 таких слов пар / множеств.
  • Данные, необходимые для этого огромен (7 Гб для английского) и, таким образом, не является частью или LanguageTool.
  • Данные (только на английском языке в настоящее время) и более документация доступна на http://wiki.languagetool.org/finding-errors-using-big-data
  • Использование ngrams делает LanguageTool немного медленнее, когда данные хранятся на SSD.
  • Если не хранится на SSD, производительность может резко снизиться.
  • С помощью нового --languagemodel вариант с клиентом командной строки, чтобы активировать правило, использует данные. Этот вариант еще не доступны для автономного GUI.

Что нового в версии 2.4.1:

  • Обновлены библиотеки Morfologik 1.8.3, чтобы исправить медленный предложения в орфографии, что сказалось, по крайней мере EN-US

Что нового в версии 2.4:

  • Бретон:
  • SRX приговор токенизации
  • добавленные / улучшилась несколько правил
  • исправлено несколько ложных тревог
  • Исправлена ​​некорректная пожелания благодаря добавленной испытаний на поправок
  • Каталонский:
  • добавленные / улучшенные несколько правил
  • фиксированные ложные тревоги
  • из дополнения и исправления к словарю Tagger
  • удалены некоторые слова из словаря синтеза (см filterarchaic.txt)
  • добавил частотные данные в словаре Tagger; Частота словник приходит из проекта Gaia, с Apache License, версия 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Английский
  • добавленные / улучшилась несколько правил
  • исправлено несколько ложных тревог
  • Французский
  • добавленные / улучшенные несколько правил
  • исправлено несколько ложных тревог
  • Немецкий:
  • добавленные / улучшенные несколько правил
  • добавил синтезатор правило Соглашение теперь могут сделать предложения для некоторых ошибок (не все предложения являются правильными, хотя)
  • польский:
  • добавил / улучшенные несколько правил, особенно для использования дефиса и тире
  • Добавлена ​​информация частоты для словаря проверки орфографии; Частота словник приходит из проекта Gaia, с Apache License, версия 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • исправлено несколько ложных тревог
  • португальский
  • добавил / улучшенные несколько правил (теперь она включает гендерные правила "A" / "O")
  • теперь имеет 3400+ сложные слова
  • файл JAR был переименован в languagetool.jar, от ранее languagetoolstandalone.jar, чтобы избежать путаницы о том, что "автономный" в данном контексте означает (GitHub вопрос # 29)
  • для языков с большим количеством правил (например, французском или немецком) производительности на длинных текстов была увеличена примерно на 2030%
  • исправление threadsafety (может вызвать висят в MultiWordChunker)
  • Исправлена ​​ошибка, когда кусков аннотации не были проверены в группах
  • Исправлена ​​ошибка: 1 и не были оценены в ...
  • Исправлена ​​ошибка в механизме объединения, что отбрасываются некоторые из согласующих интерпретаций преждевременно
  • добавлена ​​поддержка для порций аннотации в disambiguator, и фиксируется одна ошибка в фильтрации лексем порций аннотации
  • обновляются библиотеки Morfologik в версии 1.8.2 (исправлены ошибки, строже вход санитарные проверки, добавить частотные данные для словарей)
  • Добавлена ​​возможность включения частотных данные taggging или орфографических словарях. Ожидаемый формат частотных списков слов является тот в проекте Гайя, с Apache License, версия 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • новые инструменты командной строки для экспорта и создать бинарные словари:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • LibreOffice / OpenOffice интеграция:
  • добавил обхода для обнаружения неправильного приговора для случая, который появился в сноске после приговора полной остановки (Sourceforge ошибка # 191)
  • автономный графический интерфейс:
  • диалоговое открыл "Подробнее ..." пункт в контекстное меню ошибки теперь также отображения правильные и неправильные примеры предложений
  • API
  • SentenceTokenizer теперь интерфейс, реализация была перенесена на RegexSentenceTokenizer, но это не рекомендуется, и SRXSentenceTokenizer должны использоваться вместо
  • Некоторые методы из org.languagetool.tools.StringTools были перемещены в класс org.languagetool.gui.Tools в проекте languagetoolguicommons
  • LanguageToolListener.languageToolEventOccured () была переименована в LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator не является публичной больше (не должно повлиять на кого-либо)
  • удалены DanishSentenceTokenizer, которые были устаревшими в течение трех лет
  • Rule.getCorrectExamples () и Rule.getIncorrectExamples () не возвращает NULL больше, но пустой список, если нет примеров. Следовательно, setCorrectExamples () и () setIncorrectExamples не принимают нулевой больше.
  • Rule.getId () может возвращать любую строку в настоящее время, не только ASCIIonly строки (на самом деле это было до, а ограничение ASCIIonly никогда не исполняются и упоминается только в Javadoc)
  • languagetoolwikipedia: параметры командной строки для проверки дампа Википедии были упрощены. Теперь команда может быть вызвана так: Java банка languagetoolwikipedia.jar checkdata л ан е enwiki20130621pagesarticles.xml Позвоните просто "Java банку languagetoolwikipedia.jar checkdata", чтобы получить подсказку. Более одного файла может быть указано с опцией ф. Кроме того, чтобы Википедии XML свалок, CSV файлов с Tatoeba (http://tatoeba.org) теперь также поддерживается, они должны быть отфильтрованы первым содержать только соответствующий язык.

Что нового в версии 2.3:

  • Бретон:
  • добавленные / улучшилась несколько правил
  • фиксированные ложные тревоги
  • Обновленный словарь POS от Apertium (SVN r47282)
  • Каталонский:
  • добавлена ​​поддержка для кодов языков CA-ES-Валенсия (каталонский) Валенсии, который будет использоваться в LibreOffice 4.2.0
  • добавил простой замены правила с сотнями предложений запасных
  • добавленные / улучшенные несколько правил
  • фиксированные ложные тревоги
  • китайский:
  • добавил обхода для StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • Английский
  • добавил шаблоны замены для проверки правописания, чтобы лучше предложения (в настоящее время предлагает "учил" за "преподавал")
  • добавленные / улучшилась несколько правил
  • Французский
  • добавленные / улучшилась несколько правил
  • фиксированные ложные тревоги
  • обновляются POS словарь и словарь тег Hunspell в Dicollecte-4.12
  • Немецкий:
  • добавленные / улучшенные несколько правил
  • португальский
  • добавленные / улучшилась несколько правил
  • теперь имеет 3300+ сложные слова
  • украинское:
  • добавленные / улучшенные несколько правил
  • исходный код был перемещен в GitHub: https://github.com/languagetool-org/languagetool
  • LanguageTool требует Java 7 теперь
  • LanguageTool делает использование нескольких потоков в настоящее время для проверки текста на современном оборудовании, повышение производительности (это влияет на автономную версию, версию для командной строки и расширение LibreOffice / OpenOffice)
  • Синтаксис Правило:
  • предварительная поддержка новых атрибутов мин / макс, позволяющих соответствовать элемент, который появляется в заданное число раз. Например: Foo не будет соответствовать ничего или "Foo", т.е. "Foo" является обязательным Foo будет соответствовать "Foo" или "Foo Foo" Foo не будет соответствовать ничего, "Foo" или "Foo Foo" Использовать макс = "- 1" Чтобы разрешить случаи. Для мин, только 0 или 1 поддерживается (1 по умолчанию).
  • поддержка ИЛИ отчетности. Например: внутренне и в время выполнения, правило, содержащей OR-заявления превращается в нескольких правил или без-отчетности
  • .
  • Английский теперь имеет Chunker обнаружить, среди прочего, единственного и множественного существительных куски. Это документально в http://wiki.languagetool.org/using-chunks
  • автономная версия:
  • Автономная версия теперь подчеркивает ошибки с красной (орфографические ошибки) или синий (другие ошибки) линии (Панайотис Минос)
  • Помните выбор языка для следующего запуска
  • Улучшена окно и размещение диалоговое в настройках нескольких мониторов
  • встроенный сервер: если начали без аргументов использует порт по умолчанию (8081) снова
  • обновил morfologik стволов библиотеку до версии 1.7.1, чтобы позволить лучше предложения, в том числе надлежащего обращения с диакритическими знаками и узорами запасных (эквиваленты карта и REP функций в Hunspell словарей)
  • OpenOffice / LibreOffice интеграция:
  • Исправление: "О" диалог не работает в Apache OpenOffice 4.0
  • Исправлена ​​ошибка: конкретные правила страны (как, британский английский) не работает
  • API
  • В классе языка, getCountryVariants () была переименована в getCountries (), и новый метод getVariant был добавлен.
  • Некоторые методы устарели











Что нового в версии 2.2:



Что нового в версии 2.1:





Что нового в версии 2.0:




Что нового в версии 1.9:



Требования

  • Java 2 Standard Edition Runtime Environment

Другие программы разработчика Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Комментарии к LanguageTool

Комментарии не найдены
добавить комментарий
Включите картинки!