Доступно и всерьез о людях и  взаимоотношениях между ними
Добро пожаловать в Socionics.org Войти | Регистрация | Помощь

Уникальное предложение: Типирование с Виктором Гуленко по Skype!.

Re: Научные электронные библиотеки

  •  09/23/2005, 4:06

     Dmitry wrote:

    Сейчас как раз проектом занят - пишем библиотеку распознавания текста из изображения, на Java, заканчиваем.
    Поставил алгоритмы в несколько слоев:
    1 - выделение пятен (как замкнутых областей, контрастирующих с фоном.
    2 - по взаимному расположению и размеру пятен выделяем из них кандидаты на буквы (отсечь шум и картинки в тексте)

    3 - распознавание наклона текста, есть алгоритм по максимальной амлитуде колебаний вдоль строки тектса, сейчас пробую более продвинутый по наклону отдельных слов.
    4 - выделение строк, слов (одна буква иногда распознается как несколько пятен).
    5 - передача выделенных букв по одной на распознавание через нейронную сеть.

    По момему, этими задачами стоит заниматься, тока если на Давида Яна работаешь либо планируешь всю жизнь этим заниматься. Как ни крути, чтоб чо-та в этом понимать, потребна узкая специализация. Работа уж больно головоломная

    Сам я распознаванием с помощью нейронных сетей не занимался, но знаю людей, которые занимались и заебались с ними. Когда в один обучающий кластер запихивают внешне непохожие символы (но с одним значением) коэффициэнты разбалтываются. Посему чего-то более менее неплохое можно получить, объедняя похожие символы в кластеры, то бишь, для каждой буквы должно быть много кластеров

    Вообще, нейронные сети известны лет 40-50, на тему было наваято ебическое количество приложений, но решения, которое бы абсолютно удовлетворяло, не существует. Кстати,ФайнРидер, насколько я знаю, работает на структурных методах

    И еще вопрос - встречался ли с восстановлением 2.5D или 3D формы объектов из ряда стереоизображений (ряд фотографий объекта с разных точек)?
    Пока только у двух институтов подобные алгоритмы видел..

    Встречаться то встречался, но не занимался. На эту тему работ было также сделано ебическое количество. Книжек, в котрых это дело встречается, я уже добыл, тока не уверен, что они есть в сети. Могу посмотреть, где это есть, и попоробовать дать ссылку

    В тех алгоритмах нахождения опорных точек, которые я видел, изначально заложена неработоспособность в некоторых ситуациях. А при интерполяции поверхности между опорными точками легко облажаться

    Термин 2.5D неизвестен был мне

    2,5-мерность означает, что любой трехмерный объект корректно моделируется в плане (оси X, Y), а по высоте задается только одно значение Z, которое не может изменяться в пределах объекта. Таким образом, дом с двухскатной крышей не может быть смоделирован в 2,5-мерной системе, а дом с плоской крышей моделируется вполне успешно.

    ЗЫ Мне тока одно интересно - что заставило вашу контору ебацца с такими задачами (потому что иначе эту работу назвать нельзя - методы решения изначально ненадежны)

View Complete Thread


visits

Community Server