Personal tools
You are here: Home Studium und Lehre Lehrveranstaltungen Winter 2004/2005 Advanced Concepts in Document Processing
Document Actions

Advanced Concepts in Document Processing

Seminar im hauptstudium

Beschreibung

In diesem seminar werden aktuelle oder auch historische artikel zu themen aus dem bereich der dokumentenverarbeitung (strukturierung, auszeichnung, rendering usw.) gelesen und diskutiert.

Termine

  • Freitags, 13.00 - 15.00 uhr, raum: 29-037

Erste sitzung: Freitag, 15. oktober

Ziel

Überblick über wichtige forschungsfragen.

Literaturempfehlungen zum einstieg

  • Kapitel 1 bis 3 in: Wilhelm, Reinhard und Heckmann, Reinhold. Grundlagen der Dokumentenverarbeitung. Bonn: Addison-Wesley, 1996. (In der bibliothek und online verfügbar)
  • Annex A in: Charles F. Goldfarb. The SGML Handbook. Oxford: OUP, 1991.
  • “5,5 Millionen Minuten für die Menschheit ” – Zum 80. Geburtstag von Douglas Engelbart

    Zitat: “Zu den Pionieren, die mit Engelbart arbeiteten, gehörten Bill English (Miterfinder der Maus, später beim Xerox PARC), Ted Nelson (Erfinder des Hypertext-Systems Xanadu) und Charles Irby (Chefprogrammierer bei Silicon Graphics, dann General Magic).”

    Die meldung enthält auch einen link auf den video-mitschnitt der “mutter aller demos” von 1968 mit der vorstellung eines neuen eingabegerätes, der sogenannten “Maus”. Dokumentenverarbeitung spielt dabei eine wichtige rolle.

Aufgaben/unterlagen

  1. 1. Sitzung (Jacques André: “Can structured formatters prevent train crashes?”)
  2. Für die sitzung am 22. lesen Sie bitte den artikel What Should Markup Really Be? Applying theories of text to the design of markup systems von David G. Durand, Elli Mylonas und Steven J. DeRose. Fragen dazu.
  3. Für die sitzung am 5. november lesen Sie bitte den artikel Granularity in structured documents von Frans C. Heeman. Fragen dazu.
  4. Für die sitzung am 12. november lesen Sie bitte den artikel Markup Overlap: A Review and a Horse von Steven DeRose. Fragen dazu.
  5. Für die sitzung am 19. november lesen Sie bitte den artikel Evolutions in Typesetting Systems von Darrell R. Raymond (lokale PDF-version). Fragen dazu.
  6. Für die sitzung am 26. november lesen Sie bitte den artikel XMLR: XML Reduced von Liam Quin. Fragen dazu.
  7. Für die sitzung am 3. dezember lesen Sie bitte den artikel Separate compilation of structured documents von Michael J. Groves und David F. Brailsford. Fragen dazu.
  8. Für die sitzung am 10. dezember lesen Sie bitte den artikel The future of document formatting von Jeffrey H. Kingston (lokale PDF-version). Fragen dazu. Zusätzliche referenzen.
  9. Für die sitzung am 17. dezember lesen Sie bitte den artikel Datatype- and namespace-aware DTDs: A minimal extension von Vitali, Amorosi und Gessa. Fragen dazu.

    Die sitzung am 17. dezember findet erst um 15.00 uhr statt.

  10. Für die sitzung am 14. januar lesen Sie bitte den artikel The Trouble with Tables von Neil Bradley. Fragen dazu.
  11. Für die sitzung am 21. januar lesen Sie bitte den artikel Embedded Markup Considered Harmful von Ted Nelson. Fragen dazu.
  12. Für die sitzung am 28. januar lesen Sie bitte den artikel Towards Identity Conditions for Digital Documents von Allen Renear und David Dubin. Fragen dazu.
  13. Für die sitzung am 4. februar lesen Sie bitte die folgenden zwei artikel:

    Fragen dazu.

Protokolle

ProtokollModeratorProtokollant
5. sitzung Peter M. Kruse
6. sitzung Jens Lincke
7. sitzung Thomas Feustel
8. sitzung Peter M. KruseMichél Rieser
--- Mirko Otto Wolfram Fenske
10. sitzungJens Lincke Mirko Otto
11. sitzungMichél Rieser Peter M. Kruse
12. sitzungThomas FeustelJens Lincke
13. sitzungWolfram FenskeThomas Feustel

Zusätzliche referenzen

Zur 8. sitzung (“typesetting languages”):

  • Kenneth P. Brooks. A Two-view document editor with user-definable document structure. PhD dissertation, Stanford University, 1988. Link
  • Kenneth P. Brooks. “Lilac: A Two-View Document Editor”. In: IEEE Computer. Vol. 24(6), 1991, pp. 7-19. Link

    Dieser artikel ist eine zusammenfassung der obigen disseration, fügt aber noch ein paar interessante punkte hinzu, insbesondere zur praktischen benutzung. Leider ist er online nicht frei verfügbar. Die UB hat jedoch diese ausgabe von IEEE Computer. Ich habe auch eine gescannte version davon, bei bedarf bitte melden.

  • Luigi Semenzato, Edward Wang. “A Text-processing Language Should Be First a Programming Language”. Proceedings of the 1991 TeX Users Group Annual Meeting, June, 1991. Link
  • Luigi Semenzato, Edward Wang. “Aleph - a Language for Typesetting”. Proceedings of Electronic Publishing 1992, April, 1992. Link
  • Lout, das satzsystem von Jeff Kingston. Link
  • Wolfram Kahl. “Beyond Pretty-Printing: Galley Concepts in Document Formatting Combinators”. In: Proceedings of PADL'99 (LNCS 1551), pp. 76-90. Link
  • Hideya Iwasaki. “Developing a Lisp-based preprocessor for TeX documents”. In: Software: Practice and Experience 32(14), pp. 1345 - 1363. Link
  • ANT is a typesetting system inspired by TeX (written in OCaml). Link
  • cl-typesetting is a complete typesetting system written in Common Lisp using cl-pdf for the direct generation of pdf files. This enables it to be powerful, extensible, programmable and fast. It is intended to be an alternative to the TeX like typesetting systems. Link
  • The goal of the sTeXme project is to provide the Scheme programming language as a TeX scripting language. Link
  • Scheme as TeX's extension language, An \eval for TeX

Zur 10. sitzung (“Tabellen”):

Zur 11. sitzung (“stand-off markup”):

Ansprechpartner


Powered by Plone, the Open Source Content Management System