Advanced Concepts in Document Processing
Seminar im hauptstudium
Beschreibung
In diesem seminar werden aktuelle oder auch historische artikel zu themen aus dem bereich der dokumentenverarbeitung (strukturierung, auszeichnung, rendering usw.) gelesen und diskutiert.
Termine
- Freitags, 13.00 - 15.00 uhr, raum: 29-037
Erste sitzung: Freitag, 15. oktober
Ziel
Überblick über wichtige forschungsfragen.
Literaturempfehlungen zum einstieg
- Kapitel 1 bis 3 in: Wilhelm, Reinhard und Heckmann, Reinhold. Grundlagen der Dokumentenverarbeitung. Bonn: Addison-Wesley, 1996. (In der bibliothek und online verfügbar)
- Annex A in: Charles F. Goldfarb. The SGML Handbook. Oxford: OUP, 1991.
- “5,5 Millionen Minuten für die Menschheit ” – Zum 80.
Geburtstag von Douglas Engelbart
Zitat: “Zu den Pionieren, die mit Engelbart arbeiteten, gehörten Bill English (Miterfinder der Maus, später beim Xerox PARC), Ted Nelson (Erfinder des Hypertext-Systems Xanadu) und Charles Irby (Chefprogrammierer bei Silicon Graphics, dann General Magic).”
Die meldung enthält auch einen link auf den video-mitschnitt der “mutter aller demos” von 1968 mit der vorstellung eines neuen eingabegerätes, der sogenannten “Maus”. Dokumentenverarbeitung spielt dabei eine wichtige rolle.
Aufgaben/unterlagen
- 1. Sitzung (Jacques André: “Can structured formatters prevent train crashes?”)
- Für die sitzung am 22. lesen Sie bitte den artikel What Should Markup Really Be? Applying theories of text to the design of markup systems von David G. Durand, Elli Mylonas und Steven J. DeRose. Fragen dazu.
- Für die sitzung am 5. november lesen Sie bitte den artikel Granularity in structured documents von Frans C. Heeman. Fragen dazu.
- Für die sitzung am 12. november lesen Sie bitte den artikel Markup Overlap: A Review and a Horse von Steven DeRose. Fragen dazu.
- Für die sitzung am 19. november lesen Sie bitte den artikel Evolutions in Typesetting Systems von Darrell R. Raymond (lokale PDF-version). Fragen dazu.
- Für die sitzung am 26. november lesen Sie bitte den artikel XMLR: XML Reduced von Liam Quin. Fragen dazu.
- Für die sitzung am 3. dezember lesen Sie bitte den artikel Separate compilation of structured documents von Michael J. Groves und David F. Brailsford. Fragen dazu.
- Für die sitzung am 10. dezember lesen Sie bitte den artikel The future of document formatting von Jeffrey H. Kingston (lokale PDF-version). Fragen dazu. Zusätzliche referenzen.
- Für die sitzung am 17. dezember lesen Sie
bitte den artikel Datatype- and namespace-aware DTDs: A minimal
extension
von Vitali, Amorosi und Gessa. Fragen dazu.
Die sitzung am 17. dezember findet erst um 15.00 uhr statt.
- Für die sitzung am 14. januar lesen Sie bitte den artikel The Trouble with Tables von Neil Bradley. Fragen dazu.
- Für die sitzung am 21. januar lesen Sie bitte den artikel Embedded Markup Considered Harmful von Ted Nelson. Fragen dazu.
- Für die sitzung am 28. januar lesen Sie bitte den artikel Towards Identity Conditions for Digital Documents von Allen Renear und David Dubin. Fragen dazu.
- Für die sitzung am 4. februar lesen Sie
bitte die folgenden zwei artikel:
- Ulrik Petersen: Emdros – a text database engine for analyzed or annotated text
- Andreas Witt: Multiple hierarchies: new aspects of an old solution
Protokolle
| Protokoll | Moderator | Protokollant |
|---|---|---|
| 5. sitzung | Peter M. Kruse | |
| 6. sitzung | Jens Lincke | |
| 7. sitzung | Thomas Feustel | |
| 8. sitzung | Peter M. Kruse | Michél Rieser |
| --- | Mirko Otto | Wolfram Fenske |
| 10. sitzung | Jens Lincke | Mirko Otto |
| 11. sitzung | Michél Rieser | Peter M. Kruse |
| 12. sitzung | Thomas Feustel | Jens Lincke |
| 13. sitzung | Wolfram Fenske | Thomas Feustel |
Zusätzliche referenzen
Zur 8. sitzung (“typesetting languages”):
- Kenneth P. Brooks. A Two-view document editor with user-definable document structure. PhD dissertation, Stanford University, 1988. Link
- Kenneth P. Brooks. “Lilac: A Two-View Document Editor”. In: IEEE
Computer. Vol. 24(6), 1991, pp. 7-19.
Link
Dieser artikel ist eine zusammenfassung der obigen disseration, fügt aber noch ein paar interessante punkte hinzu, insbesondere zur praktischen benutzung. Leider ist er online nicht frei verfügbar. Die UB hat jedoch diese ausgabe von IEEE Computer. Ich habe auch eine gescannte version davon, bei bedarf bitte melden.
- Luigi Semenzato, Edward Wang. “A Text-processing Language Should Be First a Programming Language”. Proceedings of the 1991 TeX Users Group Annual Meeting, June, 1991. Link
- Luigi Semenzato, Edward Wang. “Aleph - a Language for Typesetting”. Proceedings of Electronic Publishing 1992, April, 1992. Link
- Lout, das satzsystem von Jeff Kingston. Link
- Wolfram Kahl. “Beyond Pretty-Printing: Galley Concepts in Document Formatting Combinators”. In: Proceedings of PADL'99 (LNCS 1551), pp. 76-90. Link
- Hideya Iwasaki. “Developing a Lisp-based preprocessor for TeX documents”. In: Software: Practice and Experience 32(14), pp. 1345 - 1363. Link
- ANT is a typesetting system inspired by TeX (written in OCaml). Link
- cl-typesetting is a complete typesetting system written in Common Lisp using cl-pdf for the direct generation of pdf files. This enables it to be powerful, extensible, programmable and fast. It is intended to be an alternative to the TeX like typesetting systems. Link
- The goal of the sTeXme project is to provide the Scheme programming language as a TeX scripting language. Link
- Scheme as TeX's extension language, An \eval for TeX
Zur 10. sitzung (“Tabellen”):
- Xinxin Wang and Derick Wood. XTABLE - A tabular editor and formatter. In: EPODD, vol. 8(2 & 3), 167179 (June & September 1995)
- Xinxin Wang and Derick Wood. An Abstract Model for Tables. In: TUGBoat 14(3), (1993), 231-237.
- Diskussion Table markup: style or structure? auf der mailingliste Infodesign Café
- In der obigen diskussion wird die tabellenkalkulation
Improv erwähnt. Hierzu
ist interessant:
Tom Yager. “What's NeXT After 1-2-3: Improv is Lotus's successor to the 1-2-3 throne”. In: BYTE October 1990, p. 147ff.
Dieser artikel (mit zwei screenshots) ist nicht online verfügbar, ich habe ihn jedoch, bei interesse bitte melden.
“Nachfolger” von Improv:
- Quantrix Modeler für Mac OS X und Windows; mit 999,- USD nicht ganz billig, aber mit "Academic"-rabatt für 249,- USD. 30-tage-demo umsonst.
- FlexiSheet für Mac OS X, open source.
- Tim Wohlberg. Hypertables: Entwicklung einer Strukturbeschreibungssprache für Tabellen in XML. Diplomarbeit, Uni Hamburg. 1999.
Zur 11. sitzung (“stand-off markup”):
- Wikipedia-artikel zu Ted Nelson
- Gary Wolfs artikel über Nelson in WIRED 3.06 (juni 1995)
- Matthias Müller-Prove: Vision and Reality of Hypertext and Graphical User Interfaces (diplomarbeit an der Uni Hamburg)