Требования к тексту для создания модулей

Индексируем модули | Требуемые модули | Программы для создания модулей


В Интернете можно найти переводы Библии во множестве форматов. Одни можно легко и быстро сконвертировать в модули MyBible, другие для этого не годятся вовсе.

Кодировка

Мы используем кодировку UTF-8 без BOM. Такая кодировка используется на большинстве сайтов в интернете. Она корректно отображает все языки.

Microsoft Windows использует свою кодировку ANSI, им удобнее для каждого языка иметь свою кодировку.
Для России это будет Windows-1251.
Для западноевропейских языков - Windows-1252 и т. д.

Если вы скачали файл в другой кодировке, его можно переконвертировать в Notepad++. Если это группа файлов, можно массово переконвертировать с помощью ANSI2Uni.

Подготовленный для преобразования в модуль текст выглядит так:

10,1,1,"В начале Бог сотворил небеса и землю."
10,1,2,"Но земля была необразована и пуста, и тьма над бездною; и Дух Божий носился над водами."
10,1,3,"И сказал Бог: да будет свет; и стал свет."
10,1,4,"Бог увидел, что свет хорош; и отделил Бог свет от тьмы."
...

То есть: один стих или одна статья в строке файла, с координатами (код книги, номер главы и номер стиха).

Предлагаемый команде MyBible для преобразования в модуль текст должен позволять автоматизированное приведение к представленному выше формату.

Для создания модулей подходят:

  • Текстовые файлы (не в формате .DOC, а .TXT или .CSV).
  • Редко, но может подойти и файл в формате .DOC. Однако Microsoft Word имеет очень свободный формат, так что каждый файл такого рода нужно оценивать отдельно.
  • В большинстве своем подойдут файлы с расширением .mybible или .SQLite3
  • Подойдет большинство модулей для "Цитаты из Библии"; впрочем, почти все существующие модули для "Цитаты" (те, которые подходят) уже преобразованы в модули MyBible.
  • Файлы формата .XML хорошо структурированы, поэтому, как правило, подходят.

Для создания модулей не годятся:

  • Подавляющее большинство файлов .PDF - здесь нередко бывают картинки сканов, а если и текст, то такой, который трудно обрабатывать/форматировать.
  • Все файлы .DJVU - это сосканированная книга в картинках низкого разрешения, а нам нужен текст.
  • Модули платных программ: они закрыты, и взламывать их мы не станем.
  • Библия онлайн. Иногда нам предлагают "взять текст с сайта". Но это титанический труд, на который у нас просто нет времени, ведь программой занимаются добровольцы. Кроме этого нам нужно работать, уделять время семье.