• - Alle Rubriken -
  • Bücher
  • Lernen / Pädagogik
  • Hörbücher
  • Software / Games / Hardware
  • Musik / Filme
  • Spiele
  • Kalender
  • Geschenke / Papeterie
  • Karten / Globen
  • Schweiz
  • Englisch und andere Fremdsprachen
  • Lieferbar
  • Neuheit
  • Archiv
  • - Alle Rubriken -
  • Bücher
  • Lernen / Pädagogik
  • Hörbücher
  • Software / Games / Hardware
  • Musik / Filme
  • Spiele
  • Kalender
  • Geschenke / Papeterie
  • Karten / Globen
  • Schweiz
  • Englisch und andere Fremdsprachen
  • - Alle -
  • Audio CD
  • Audio MP3
  • Blu-ray
  • CD ROM, DVD-ROM
  • DVD-Video
  • E-Book EPUB
  • E-Book PDF
  • Hardcover, gebunden
  • Taschenbuch, kartoniert
  • - Alle -
  • Aargauer Mundart
  • Abchasisch (apsua)
  • Aceh-sprache (atje-sprache)
  • Acholi-sprache
  • Adangme-sprache
  • Adygei-sprache
  • Aegyptisch
  • Afrihili
  • Afrikaans
  • Ainu
  • Akan-sprache
  • Akkadisch (assyrisch-babylonisch)
  • Albanisch
  • Alemannisch
  • Algonkin-sprachen
  • Altaethiopisch
  • Altaische Sprachen (andere)
  • Altenglisch (ca. 450-1100)
  • Altfranzoesisch (842-ca. 1400)
  • Althochdeutsch (ca. 750-1050)
  • Altirisch (bis 900)
  • Altnorwegisch
  • Altprovenzalisch (bis 1500)
  • Amharisch
  • Apachen-sprache
  • Appenzellerdeutsch
  • Arabisch
  • Aragonisches Spanisch
  • Aramaeisch
  • Arapaho-sprache
  • Arawak-sprachen
  • Armenisch
  • Aserbaidschanisch (azerbajdzanisch)
  • Assamesisch (asamiya)
  • Asturisch
  • Athapaskische Sprachen
  • Australische Sprachen
  • Austronesische Sprachen
  • Aymara-sprache
  • Bahasa Indonesia
  • Baltische Sprachen
  • Bambara-sprache
  • Bantusprachen
  • Basaa-sprache
  • Baschkirisch
  • Baseldeutsch
  • Baskisch
  • Bayrisch
  • Beach-la-mar
  • Bedauye
  • Bemba-sprache
  • Bengali
  • Berbersprachen
  • Berlinerisch
  • Berndeutsch
  • Bhojpuri (bajpuri)
  • Birmanisch
  • Bokmal
  • Bosnisch
  • Braj-bhakha
  • Brandenburger Mundart
  • Bretonisch
  • Bugi-sprache
  • Bulgarisch
  • Caddo-sprachen
  • Cebuano
  • Chamorro-sprache
  • Cherokee-sprache
  • Chinesisch
  • Chinook-jargon
  • Chipewyan
  • Choctaw-sprache
  • Cree-sprache
  • Daenisch
  • Dakota-sprache
  • Danakil-sprache
  • Delaware-sprache
  • Deutsch
  • Dinka-sprache
  • Dogrib-sprache
  • Drawidische Sprachen
  • Dzongkha
  • Efik
  • Elamisch
  • Elsaessisch
  • Englisch
  • Ersjanisch
  • Esperanto
  • Estnisch
  • Ewe-sprache
  • Faeroeisch
  • Fanti-sprache
  • Farsi
  • Fidschi-sprache
  • Filipino
  • Finnisch
  • Finnougrische Sprachen
  • Fon-sprache
  • Fraenkisch
  • Franzoesisch
  • Friulisch
  • Ful
  • Ga
  • Gaelisch-schottisch
  • Galicisch
  • Galla-sprache
  • Ganda-sprache
  • Georgisch
  • Germanische Sprachen
  • Gilbertesisch
  • Glarner Mundart
  • Gotisch
  • Griechisch (bis 1453)
  • Groenlaendisch
  • Guarani-sprache
  • Gujarati-sprache
  • Haida-sprache
  • Haitisches Creolisch
  • Hamitosemitische Sprachen
  • Haussa-sprache
  • Hawaiisch
  • Hebraeisch
  • Herero-sprache
  • Hessisch
  • Hiligaynon-sprache
  • Himachali
  • Hindi
  • Iban
  • Ibo-sprache
  • Ido
  • Ilokano-sprache
  • Indianersprachen (nordamerik.)
  • Indianersprachen (suedamerik.)
  • Indianersprachen / Zentralamerika
  • Indoarische Sprachen
  • Indogermanische Sprachen
  • Ingush-sprache
  • Interlingua (iala)
  • Interlingue
  • Inuktitut
  • Iranische Sprachen
  • Irisch
  • Irokesische Sprachen
  • Islaendisch
  • Italienisch
  • Japanisch
  • Javanisch
  • Jiddisch
  • Judenspanisch
  • Juedisch-arabisch
  • Kabardinisch
  • Kabylisch
  • Kambodschanisch
  • Kannada
  • Karenisch
  • Karibische Sprachen
  • Kasachisch
  • Kaschmiri
  • Katalanisch
  • Kaukasische Sprachen
  • Kein Sprachlicher Inhalt
  • Keltische Sprachen
  • Khasi-sprache
  • Khoisan-sprachen
  • Kikuyu-sprache
  • Kirchenslawisch
  • Kirgisisch
  • Klassisches Syrisch
  • Koelsch
  • Komi-sprachen
  • Kongo
  • Konkani
  • Koptisch
  • Koreanisch
  • Kornisch
  • Korsisch
  • Kpelle-sprache
  • Kreolisch-englisch
  • Kreolisch-franzoesisch
  • Kreolisch-portugiesisch
  • Kreolische Sprachen
  • Kroatisch
  • Kru-sprachen
  • Kurdisch
  • Kurdisch (sorani)
  • Kutchin
  • Laotisch
  • Latein
  • Lesgisch
  • Lettisch
  • Lingala
  • Litauisch
  • Luba-sprache
  • Luiseno-sprache
  • Lulua-sprache
  • Luo-sprache
  • Luxemburgisch
  • Maduresisch
  • Maithili
  • Malagassisch
  • Malaiisch
  • Malayalam
  • Maledivisch
  • Malinke-sprache
  • Maltesisch
  • Manchu
  • Mandaresisch
  • Manx
  • Maori-sprache
  • Marathi
  • Marschallesisch
  • Massai-sprache
  • Maya-sprachen
  • Mazedonisch
  • Meithei-sprache
  • Miao-sprachen
  • Micmac-sprache
  • Mittelenglisch (1100-1500)
  • Mittelfranzoesisch (ca. 1400-1600)
  • Mittelhochdeutsch (ca. 1050-1500)
  • Mittelirisch (900-1200)
  • Mittelniederlaendisch (ca. 1050-1350)
  • Mohawk-sprache
  • Mon-khmer-sprachen
  • Mongolisch
  • Montenegrinisch
  • Mossi-sprache
  • Mundart
  • Muskogee-sprachen
  • Nahuatl
  • Navajo-sprache
  • Ndebele-sprache (nord)
  • Ndebele-sprache (sued)
  • Ndonga
  • Neapolitanisch
  • Nepali
  • Neugriechisch (nach 1453)
  • Neumelanesisch
  • Newari
  • Niederdeutsch
  • Niederlaendisch
  • Nigerkordofanische Sprachen
  • Nogaiisch
  • Nordfriesisch
  • Nordsaamisch
  • Norwegisch (bokmal)
  • Nubische Sprachen
  • Nyanja-sprache
  • Nyankole
  • Nyoro
  • Obersorbisch
  • Obwaldner Mundart
  • Ojibwa-sprache
  • Okzitanisch (nach 1500)
  • Oriya-sprache
  • Osmanisch
  • Ossetisch
  • Palau
  • Pali
  • Pandschabi-sprache
  • Papiamento
  • Papuasprachen
  • Paschtu
  • Pehlewi
  • Persisch
  • Philippinen-austronesisch
  • Phoenikisch
  • Plattdeutsch
  • Polnisch
  • Polyglott
  • Portugiesisch
  • Prakrit
  • Quechua-sprache
  • Raetoromanisch
  • Rajasthani
  • Romani
  • Romanisch
  • Romanische Sprachen
  • Ruhrdeutsch
  • Rumaenisch
  • Rundi-sprache
  • Russisch
  • Rwanda-sprache
  • Saamisch
  • Saarlaendisch
  • Saechsisch
  • Salish-sprache
  • Samoanisch
  • Sango-sprache
  • Sanskrit
  • Santali
  • Sardisch
  • Schaffhauser Mundart
  • Schona-sprache
  • Schottisch
  • Schwaebisch
  • Schwedisch
  • Schweizerdeutsch
  • Semitische Sprachen
  • Serbisch
  • Sidamo
  • Sindhi-sprache
  • Singhalesisch
  • Sinotibetische Sprachen
  • Sioux-sprachen
  • Slave (athapaskische Sprachen)
  • Slawische Sprachen
  • Slowakisch
  • Slowenisch
  • Solothurner Mundart
  • Somali
  • Soninke-sprache
  • Sorbisch
  • Sotho-sprache (nord)
  • Sotho-sprache (sued)
  • Spanisch
  • Sumerisch
  • Sundanesisch
  • Swahili
  • Swazi
  • Syrisch
  • Tadschikisch
  • Tagalog
  • Tahitisch
  • Tamaseq
  • Tamil
  • Tatarisch
  • Telugu-sprache
  • Temne
  • Tetum-sprache
  • Thailaendisch
  • Thaisprachen (andere)
  • Tibetisch
  • Tigre-sprache
  • Tigrinya-sprache
  • Tlingit-sprache
  • Tonga (bantusprache, Malawi)
  • Tongaisch (sprache Auf Tonga)
  • Tschagataisch
  • Tschechisch
  • Tschetschenisch
  • Tschuwaschisch
  • Tsonga-sprache
  • Tswana-sprache
  • Tuerkisch
  • Tumbuka
  • Tupi-sprache
  • Turkmenisch
  • Udmurt-sprache
  • Ugaritisch
  • Uigurisch
  • Ukrainisch
  • Unbestimmt
  • Ungarisch
  • Urdu
  • Usbekisch
  • Vai-sprache
  • Venda-sprache
  • Verschiedene Sprachen
  • Vietnamesisch
  • Volapuek
  • Volta-comoe-sprachen
  • Wakashanisch
  • Walamo-sprache
  • Walisisch
  • Walliser Mundart
  • Wallonisch
  • Weissrussisch
  • Welthilfssprache
  • Westfriesisch
  • Wienerisch
  • Wolof-sprache
  • Xhosa-sprache
  • Yao-sprache
  • Yoruba-sprache
  • Yupik-sprache
  • Zapotekisch
  • Zeichensprache
  • Zhuang
  • Zuerichdeutsch
  • Zulu
  • Relevanz
  • Autor
  • Erscheinungsjahr
  • Preis
  • Titel
  • Verlag
Zwischen und
Kriterien zurücksetzen

Probabilistic Indexing for Information Search and Retrieval in Large Collections of Handwritten Text Images (Toselli, Alejandro Héctor / Vidal, Enrique / Puigcerver, Joan)
Probabilistic Indexing for Information Search and Retrieval in Large Collections of Handwritten Text Images
Autor Toselli, Alejandro Héctor / Vidal, Enrique / Puigcerver, Joan
Verlag Springer Nature Switzerland
Sprache Englisch
Einband Fester Einband
Erscheinungsjahr 2024
Seiten 380 S.
Artikelnummer 46409981
ISBN 978-3-031-55388-2
Auflage 2024
Reihe The Information Retrieval Series
Reihenbandnummer 49
CHF 215.00
Zusammenfassung

This book provides a comprehensive presentation of a recently introduced framework, named "probabilistic indexing" (PrIx), for searching text in large collections of document images and other related applications. It fosters the development of new search engines for effective information retrieval from manuscripts which, however, lack the electronic text (transcripts) that would typically be required for such search and retrieval tasks. The book is structured into 11 chapters and three appendices. The first two chapters briefly outline the necessary fundamentals and state of the art in pattern recognition, statistical decision theory, and handwritten text recognition. Chapter 3 presents approaches for indexing (as opposed to ¿spotting¿) each region of a handwritten text image which is likely to contain a word. Next, Chapter 4 describes models adopted for handwritten text in images, namely hidden Markov models, convolutional and recurrent neural networks and language models, and provides full details of weighted finite-state transducer (WFST) concepts and methods, needed in further chapters of the book. Chapter 5 explains the set of techniques and algorithms developed to generate image probabilistic indexes which allow for fast search and retrieval of textual information in the indexed images. Chapter 6 then presents experimental evaluations of the proposed framework and algorithms on different traditional benchmark datasets and compares them with other approaches, while Chapter 7 reviews the most popular keyword-spotting approaches. Chapter 8 explains how PrIx can support classical free-text search tools, while Chapter 9 presents new methods that use PrIx not only for searching, but also to deal with text analytics and other related natural language processing and information extraction tasks. Chapter 10 shows how the proposed solutions can be used to effectively index very large collections of handwritten document images, before Chapter 11 eventually summarizes the book and suggests promising lines of future research. The appendices detail the necessary mathematical foundations for the work and presents details of the text image collections and datasets used in the experiments throughout the book. This book is written for researchers and (post-)graduate students in pattern recognition and information retrieval. It will also be of interest to people in areas like history, criminology, or psychology who need technical support to evaluate, understand or decode historical or contemporary handwritten text.

Alejandro Héctor Toselli, is currently working as a PostDoc (María Zambrano grant) at the Universitat Politècnica de València. He obtained an Electrical Engineer degree from the University Nacional de Tucumán (Argentina, 1997) and a Phd in Computer Science from the Universitat Politècnica de València (UPV) (Spain, 2004). His research expertise focuses primarily on Document Analysis and Recognition, in which he has more than 20 years of experience, publishing on these topics and working on related projects funded by European and US institutions. He held a Post-Doctoral Fellow at Northeastern University (Boston, USA) in the the multi-institutional Open Islamicate Texts Initiative (OpenITI) and at the "Institut de Recherche en Informatique et Systèmes Aléatoires" (IRISA, Rennes France).

Joan Puigcerver received his MSc and PhD in Computer Science from the Universitat Politècnica de València, in 2014 and 2018, respectively, focusing on probabilistic indexing and handwritten text recognition. In 2018, he joined Google Research as a software engineer. His research focuses on deep learning architectures, transfer learning, and computer vision. Joan is a member of the Spanish Society for Pattern Recognition and Image Analysis (AERFAI), an affiliate organization of the International Association for Pattern Recognition (IAPR).

Enrique Vidal is an emeritus professor of the Universitat Politècnica de València (Spain) and former co-leader of the PRHLT research center there. He is co-author of hundreds of research papers in the fields of Pattern Recognition, Multimodal Interaction and applications to Language, Speech and Image Processing and has led many important projects in these fields. Enrique is a fellow of the International Association for Pattern Recognition (IAPR).