Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
Всём привет, люблю читать книги, но не в одной читалке не нашел функции сохранения фрагмента и пометки его тегом. Мне нужно помечать фрагменты текста тегами, чтобы находить общее у разных книг и работать с этим. Решил писать свой велосипед Пока думаю как сам костяк правильно сделать - книги можно хранить как в бд, так и в файловой системе, фс - вроде как на порядок эктномней по ресурсам. А сами фрагменты уже в бд У кого есть опыт в этом, поделитесь пж ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2016, 11:16 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
SputnickВсём привет, люблю читать книги, но не в одной читалке не нашел функции сохранения фрагмента и пометки его тегом. Сейчас про какие "читалки" идёт речь? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2016, 10:52 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
дело хорошее, нужное. Но, проблема конверсии в свой формат..... по мне, проще копипастить к себе, во что-то типа вики. или загонять тексты под систему полнотекстового поиска. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2016, 11:46 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
Vladimir Baskakov, если проблема с конверсией, то вот https://calibre-ebook.com/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2016, 11:49 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
Sputnick, Тексты лучше хранить в БД по-блочно. Текст у книг большой, значит загрузка всей книги в память, чтобы открыть одну страницу — дело не выгодное. Хранить по главам, частям, и т.п. тоже не правильно, так как главы могут быть конских размеров. Выгодно разбивать текст на небольшие части и склеивать их для отображения на лету. Удобно делать ссылки, которые однозначно будут ссылаться на блок и позицию в нём. Хранить в файлах, чтобы потом внутрь файла куда-то там ссылаться — шляпа полная, поимеешь огромный букет проблем. Вообще не слушай, кто там говорит, что хранение файлов в ФС это правильно. Это правильно только в одном случае, когда ты работаешь с огромной кучей безликих файлов, которые просто хранишь и отдаёшь по запросу. Если тебе нужно интенсивно работать с содержанием, значит только в БД! Даже не парься по этому поводу. БД и точка. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2016, 12:32 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
угу. а кто будет большие книги резать на блоки осмысленные и загонять в базу. Это же вычитка! это редакторская почти работа. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2016, 14:11 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
да ну просто ж можно..параграфы загонять как отдельные записи и все. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2016, 15:04 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
Vladimir Baskakovугу. а кто будет большие книги резать на блоки осмысленные и загонять в базу. Это же вычитка! это редакторская почти работа. Блоки по 1-10кб. Посмотри, например, файлохранилище в монге именно так и хранит файлы, в чанках. Проверенный временем механизм. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.12.2016, 03:45 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
handmadeFromRuда ну просто ж можно..параграфы загонять как отдельные записи и все. Можно, но без видимого профита. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.12.2016, 03:47 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
handmadeFromRu, В 1800-х годах, в те времена, когда не было еще ни железных, ни шоссейных дорог, ни газового, ни стеаринового света, ни пружинных низких диванов, ни мебели без лаку, ни разочарованных юношей со стеклышками, ни либеральных философов-женщин, ни милых дам-камелий, которых так много развелось в наше время, - в те наивные времена, когда из Москвы, выезжая в Петербург в повозке или карете, брали с собой целую кухню домашнего приготовления, ехали восемь суток по мягкой, пыльной или грязной дороге и верили в пожарские котлеты, в валдайские колокольчики и бублики, - когда в длинные осенние вечера нагорали сальные свечи, освещая семейные кружки из двадцати и тридцати человек, на балах в канделябры вставлялись восковые и спермацетовые свечи, когда мебель ставили симметрично, когда наши отцы были еще молоды не одним отсутствием морщин и седых волос, а стрелялись за женщин и из другого угла комнаты бросались поднимать нечаянно и не нечаянно уроненные платочки, наши матери носили коротенькие талии и огромные рукава и решали семейные дела выниманием билетиков, когда прелестные дамы-камелии прятались от дневного света, - в наивные времена масонских лож, мартинистов, тугендбунда, во времена Милорадовичей, Давыдовых, Пушкиных, - в губернском городе К. был съезд помещиков, и кончались дворянские выборы. Война и Мир :) это даже не параграф, это предложение. А есть какой-то автор, вся книга которого вообще одно предложение, не могу вспомнить его имя. Поэтому физическое деление по логическим частям -- не вариант. Оглавление надо делать отдельно со ссылками на блоки. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.12.2016, 06:26 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
во, я и говорю, прежде чем начать читать на новой читалке нужно или вычитать вручную, хотя бы по диагонали, или распарсить в свой, по чанкам формат из другого где есть оглавление с разделами, главами, параграфами при этом, экономия времени от второго прочтения компенсируется необходимостью первого, технического. Дальше, если цитировать в научном стиле, с номером страниц в каком-то конкретном издании, то все еще интереснее.... не то что совсем нерешаемо, но нетривиально. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.12.2016, 09:38 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
hVosttМожно, но без видимого профита. ну ок может быть. я делал проект по анализу контрактов и его совместному редактированию, логические блоки сложно найти. а вот параграфы легко. Если текст без параграфов ну эт даж для чтения крайне неудобно. Все таки параграфы вносит упорядочность и структурность. И если автор не использует их то по моему эт фейл, я конечно не эксперт литературы, но много читаю книг, особенно фантастику/научную фантастику. А предложения как ты привел из "войны и мир" воспринимаются плохо с такой длиной, про книги из 1 предложения - ваще ад. Представь ты читаешь и думаешь вот щас дочитаю до точки, мысль кончится, а завтра продолжу и тут такой поворот судьбы) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2016, 08:30 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
ну, таких нечитаемых текстов ==в одно предложение== почти нет, и в итоге то предложения там наверное есть, но не порезанные знаками препинания, и намеренно сгруппированные так, что конец одного может быть началом другого. а бывает так, что предложения есть но утонешь..... Пруст, постмодернисты некоторые, Джойс.... ой, и не знал что все уже написано.... а теперь буду знать. https://github.com/larin/librusec ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2016, 09:51 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
handmadeFromRu, Мне кажется, что параграфы как физическое разделение -- всё-таки не очень хорошее решение. Размеры параграфов очень разные и сколько тебе параграфов надо выбрать, чтобы отобразить страницу? Сами параграфы могут быть частью, как логических глав, так и просто стилистических блоков, например, в книге приводится текст письма, который не является отдельным разделом, состоит из параграфов, но выводится в другом стиле (например, наклонным шрифтом). Или ремарки, цитаты и прочее. Всякие нумерованные списки и прочее. Параграф по сути это оформление, а не законченный самостоятельный блок. Он может включать в себя другое оформление, так и быть частью другого логически-стилистического блока. Поэтому вместо ожидаемого профита, получится боль. Представь разделение по блокам конкретного размера, как разделение по страницам. Каждая страница может вмещать в себя не больше определённого количества текста. Страница может легко разрывать любые стилистические блоки, и это будет общее решение, подходящее для любых случаев. Даже для самых упоротых. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2016, 09:53 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
Под блоками я имею в виду именно текстовые блоки, а не байтовые. Блок должен знать с каким стилистическим оформлением продолжается текст, чтобы не поднимать предыдущие блоки и не парсить их в надежде отыскать концы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2016, 09:56 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
hVostt, А я не говорил что это хорошее решение) я имел ввиду самое простое. Мы у себя на проекте позволяли человеку указывать логические области, так не представляли как такое описать на языке программирования. Страницы как разделить актуальнее, но если меняется шрифт и стиль то кол-во страниц также меняет и на них не завязаться. Блоки с определенным кол-вом данных не совсем уместно по причине что в зависимости от стилей кол-во данных на странице может быть и больше и меньше, к примеру в 10 шрифте влезет 200 символов на экран, а с 15 всего 100 (пример из пальца). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2016, 11:01 |
|
||
|
Своя онлайн читалка
|
|||
|---|---|---|---|
|
#18+
handmadeFromRu, Ну страница не имеется в виду прям А4 текста, или экран. Тут и экран может быть разных размеров и т.д. Страница, это некий удобный и оптимальный для работы с ним размер блока. Примерно такой, чтобы для большинства случаев для отображения понадобилось загрузить не больше 1-2 блоков. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2016, 11:31 |
|
||
|
|

start [/forum/topic.php?fid=18&msg=39375348&tid=1355647]: |
0ms |
get settings: |
5ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
25ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
35ms |
get tp. blocked users: |
1ms |
| others: | 224ms |
| total: | 318ms |

| 0 / 0 |
