powered by simpleCommunicator - 2.0.59     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / ASP.NET [игнор отключен] [закрыт для гостей] / Своя онлайн читалка
17 сообщений из 17, страница 1 из 1
Своя онлайн читалка
    #39374315
Фотография Sputnick
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Всём привет, люблю читать книги, но не в одной читалке не нашел функции сохранения фрагмента и пометки его тегом. Мне нужно помечать фрагменты текста тегами, чтобы находить общее у разных книг и работать с этим. Решил писать свой велосипед

Пока думаю как сам костяк правильно сделать - книги можно хранить как в бд, так и в файловой системе, фс - вроде как на порядок эктномней по ресурсам. А сами фрагменты уже в бд


У кого есть опыт в этом, поделитесь пж
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375094
Фотография Нахлобуч
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SputnickВсём привет, люблю читать книги, но не в одной читалке не нашел функции сохранения фрагмента и пометки его тегом.
Сейчас про какие "читалки" идёт речь?
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375147
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
дело хорошее, нужное.

Но, проблема конверсии в свой формат..... по мне, проще копипастить к себе, во что-то типа вики. или загонять тексты под систему полнотекстового поиска.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375152
Фотография big-duke
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Vladimir Baskakov,
если проблема с конверсией, то вот https://calibre-ebook.com/
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375191
Фотография hVostt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Sputnick,

Тексты лучше хранить в БД по-блочно. Текст у книг большой, значит загрузка всей книги в память, чтобы открыть одну страницу — дело не выгодное. Хранить по главам, частям, и т.п. тоже не правильно, так как главы могут быть конских размеров. Выгодно разбивать текст на небольшие части и склеивать их для отображения на лету. Удобно делать ссылки, которые однозначно будут ссылаться на блок и позицию в нём.

Хранить в файлах, чтобы потом внутрь файла куда-то там ссылаться — шляпа полная, поимеешь огромный букет проблем.

Вообще не слушай, кто там говорит, что хранение файлов в ФС это правильно. Это правильно только в одном случае, когда ты работаешь с огромной кучей безликих файлов, которые просто хранишь и отдаёшь по запросу. Если тебе нужно интенсивно работать с содержанием, значит только в БД! Даже не парься по этому поводу. БД и точка.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375303
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
угу. а кто будет большие книги резать на блоки осмысленные и загонять в базу. Это же вычитка! это редакторская почти работа.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375348
handmadeFromRu
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
да ну просто ж можно..параграфы загонять как отдельные записи и все.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375732
Фотография hVostt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Vladimir Baskakovугу. а кто будет большие книги резать на блоки осмысленные и загонять в базу. Это же вычитка! это редакторская почти работа.

Блоки по 1-10кб. Посмотри, например, файлохранилище в монге именно так и хранит файлы, в чанках. Проверенный временем механизм.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375733
Фотография hVostt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
handmadeFromRuда ну просто ж можно..параграфы загонять как отдельные записи и все.

Можно, но без видимого профита.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375755
Фотография hVostt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
handmadeFromRu,

В 1800-х годах, в те времена, когда не было еще ни железных, ни шоссейных дорог, ни газового, ни стеаринового света, ни пружинных низких диванов, ни мебели без лаку, ни разочарованных юношей со стеклышками, ни либеральных философов-женщин, ни милых дам-камелий, которых так много развелось в наше время, - в те наивные времена, когда из Москвы, выезжая в Петербург в повозке или карете, брали с собой целую кухню домашнего приготовления, ехали восемь суток по мягкой, пыльной или грязной дороге и верили в пожарские котлеты, в валдайские колокольчики и бублики, - когда в длинные осенние вечера нагорали сальные свечи, освещая семейные кружки из двадцати и тридцати человек, на балах в канделябры вставлялись восковые и спермацетовые свечи, когда мебель ставили симметрично, когда наши отцы были еще молоды не одним отсутствием морщин и седых волос, а стрелялись за женщин и из другого угла комнаты бросались поднимать нечаянно и не нечаянно уроненные платочки, наши матери носили коротенькие талии и огромные рукава и решали семейные дела выниманием билетиков, когда прелестные дамы-камелии прятались от дневного света, - в наивные времена масонских лож, мартинистов, тугендбунда, во времена Милорадовичей, Давыдовых, Пушкиных, - в губернском городе К. был съезд помещиков, и кончались дворянские выборы.

Война и Мир :) это даже не параграф, это предложение. А есть какой-то автор, вся книга которого вообще одно предложение, не могу вспомнить его имя. Поэтому физическое деление по логическим частям -- не вариант. Оглавление надо делать отдельно со ссылками на блоки.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39375807
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
во, я и говорю, прежде чем начать читать на новой читалке нужно или вычитать вручную, хотя бы по диагонали, или распарсить в свой, по чанкам формат из другого где есть оглавление с разделами, главами, параграфами

при этом, экономия времени от второго прочтения компенсируется необходимостью первого, технического.

Дальше, если цитировать в научном стиле, с номером страниц в каком-то конкретном издании, то все еще интереснее.... не то что совсем нерешаемо, но нетривиально.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39376527
handmadeFromRu
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
hVosttМожно, но без видимого профита.
ну ок может быть. я делал проект по анализу контрактов и его совместному редактированию, логические блоки сложно найти. а вот параграфы легко. Если текст без параграфов ну эт даж для чтения крайне неудобно. Все таки параграфы вносит упорядочность и структурность. И если автор не использует их то по моему эт фейл, я конечно не эксперт литературы, но много читаю книг, особенно фантастику/научную фантастику. А предложения как ты привел из "войны и мир" воспринимаются плохо с такой длиной, про книги из 1 предложения - ваще ад. Представь ты читаешь и думаешь вот щас дочитаю до точки, мысль кончится, а завтра продолжу и тут такой поворот судьбы)
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39376578
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ну, таких нечитаемых текстов ==в одно предложение== почти нет, и в итоге то предложения там наверное есть, но не порезанные знаками препинания, и намеренно сгруппированные так, что конец одного может быть началом другого. а бывает так, что предложения есть но утонешь..... Пруст, постмодернисты некоторые, Джойс....

ой, и не знал что все уже написано.... а теперь буду знать.
https://github.com/larin/librusec
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39376579
Фотография hVostt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
handmadeFromRu,

Мне кажется, что параграфы как физическое разделение -- всё-таки не очень хорошее решение. Размеры параграфов очень разные и сколько тебе параграфов надо выбрать, чтобы отобразить страницу? Сами параграфы могут быть частью, как логических глав, так и просто стилистических блоков, например, в книге приводится текст письма, который не является отдельным разделом, состоит из параграфов, но выводится в другом стиле (например, наклонным шрифтом). Или ремарки, цитаты и прочее. Всякие нумерованные списки и прочее. Параграф по сути это оформление, а не законченный самостоятельный блок. Он может включать в себя другое оформление, так и быть частью другого логически-стилистического блока. Поэтому вместо ожидаемого профита, получится боль.

Представь разделение по блокам конкретного размера, как разделение по страницам. Каждая страница может вмещать в себя не больше определённого количества текста. Страница может легко разрывать любые стилистические блоки, и это будет общее решение, подходящее для любых случаев. Даже для самых упоротых.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39376583
Фотография hVostt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Под блоками я имею в виду именно текстовые блоки, а не байтовые. Блок должен знать с каким стилистическим оформлением продолжается текст, чтобы не поднимать предыдущие блоки и не парсить их в надежде отыскать концы.
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39376641
handmadeFromRu
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
hVostt,

А я не говорил что это хорошее решение) я имел ввиду самое простое. Мы у себя на проекте позволяли человеку указывать логические области, так не представляли как такое описать на языке программирования. Страницы как разделить актуальнее, но если меняется шрифт и стиль то кол-во страниц также меняет и на них не завязаться. Блоки с определенным кол-вом данных не совсем уместно по причине что в зависимости от стилей кол-во данных на странице может быть и больше и меньше, к примеру в 10 шрифте влезет 200 символов на экран, а с 15 всего 100 (пример из пальца).
...
Рейтинг: 0 / 0
Своя онлайн читалка
    #39376675
Фотография hVostt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
handmadeFromRu,

Ну страница не имеется в виду прям А4 текста, или экран. Тут и экран может быть разных размеров и т.д. Страница, это некий удобный и оптимальный для работы с ним размер блока. Примерно такой, чтобы для большинства случаев для отображения понадобилось загрузить не больше 1-2 блоков.
...
Рейтинг: 0 / 0
17 сообщений из 17, страница 1 из 1
Форумы / ASP.NET [игнор отключен] [закрыт для гостей] / Своя онлайн читалка
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]