speedparser является черный ящик перевыполнение Всеобщей канал синтаксического анализа. Он использует LXML для подачи разбора и для дополнительного HTML очистки и NBSP; совместимость. Speedparser с feedparser очень хорошо для строгого подмножества полей, но плохое для полей вне этого подмножества. См тесты / speedparsertests.py для получения дополнительной информации, по которой поля являются более или менее совместимы и которые не являются.
На Intel Core i5 750, под управлением только на одном ядре, feedparser удалось 2,5 каналы / сек на тестовый набор кормов (примерно 4200 "каналы" в тестах / feeds.tar.bz2), в то время как speedparser управляет около 65 каналы / сек с HTML . очистки, и 200-каналы / сек с очистки от
Требования
- Python
- LXML
Комментарии не найдены