[linux-l] Daten aus WWW in OO

Thomas Schmidt belug at thomasschmidt.com
So Mär 2 12:36:00 CET 2008


Hallo Jörg!

Danke für deine interessante Antwort.
>> Da taucht das erste Problem auf: Jedes OpenOffice interpretiert das
>> HTML-Dokument anders,
>>     
> Definiere mal "Jedes".
>   
Es kommt auf die in OOo eingestellte Sprache an. Wenn ich den üblichen 
Dezimalpunkt verwende, haut mir ein OOo mit deutschen 
Systemeinstellungen die Zahlen um die Ohren.

>> abhängig von der eingestellten Sprache.
>> Kann ich
>> in HTML die Sprache vorgeben, so dass OpenOffice die Zellen immer
>> englisch mit Dezimalpunkt erkennt?
>>     
> Mmmh, da bin ich jetzt garnicht sicher, weil ich nie darauf geachtet
> habe wie der HTML-Import konkret ausgeführt wird ... es gibt aber beim
> cvs-Import an dieser Stelle eine Besonderheit und könnte sein das die
> auch beim HTML-Import Auswirkungen hat.
>   
Wie könnte das funktionieren? Der CSV-Import-Dialog kommt bei der 
Verlinkung ja nicht.

> Nenne doch mal einige Beispieldsokumente und einige OOo-Versionen, die
> sich anders verhalten, vielleicht finde ich Zeit das gegenzuprüfen und
> wir gelangen evtl. gemeinsam zu einer Lösung.
>   
http://webspace.netaction.de/tmp/OOo-Test/test.html
Die Tabelle mit der ID Englische Testtabelle lässt sich in meinem 
deutschen System nicht sinnvoll verlinken

>> Falls das nicht geht, muss ich die Daten in verschiedenen
>> Formatierungen
>> auf dem Server anbieten, was auch nicht so schlimm wäre.
>>     
> Das würde ich mir aus ergonomischen Gründen überlegen, viele Nutzer
> dürften garnicht wissen welche OOo-Version sie haben.
>   
Wie bei ihnen der Dezimalpunkt aussieht, werden sie sicherlich wissen. 
Aber blöd ist es auf jeden Fall. Zumal die Dokumente dann nicht mehr 
über Systeme hinweg austauschbar sind.

Wofür ich weiterhin keine Abhilfe finden konnte: Der Server gibt Strings 
in der Form "3:4" heraus. Also Verhältnisse. Wie bekomme ich OpenOffice 
dazu, die als Strings und nicht als Uhrzeit anzusehen? Wenn ich die 
Strings jeweils in " einklammere, erscheinen diese in der Tabelle.

[...]
> Wenn ich es richtig verstehe ist die genannte Formel dafür mit
> Sicherheit viel zu kompliziert und wahrscheinlich sogar falsch.
> Für den Fall das die DatenTabelle in A1 beginnt und somit in A1 bis C1
> die Überschriften stehen und in A2 bis C2 der erste Datensatz, schreibe
> in D2:
>
> =(B2="Tag")*C2
>   
Langsam verstehe ich Calc.
Calc haut also erst einmal alle Informationen in eine Tabelle, auch wenn 
sie gar nicht reinpassen. Meine HTML-Tabelle hat Bezeichner in der 
Kopfzeile und die Daten in den Datenzellen. Ich hätte erwartet, dass die 
Daten bei A1 anfangen und die Bezeichner extra gespeichert werden, wie 
ich es von Datenbanken gewohnt bin. Es ist aber nicht so.
Zweitens wollte ich die Spalte nicht nach ihrer Nummer aussuchen. Es 
kann ja gut sein, dass ich im Server irgendwo eine Spalte rausnehme oder 
umsortiere. Dann muss ich aus C2 D2 machen, obwohl es die 
"Tageszeit"-Spalte bleibt. Weiterhin sehe ich den Sinn in der Sache 
nicht, dass ich Spalten mit kryptischen Kürzeln bezeichnen soll, obwohl 
sie eigentlich Namen haben. Außer eben, dass es auf den ersten Blick 
einfacher erscheint.

Calc ist aber wohl dafür vorgesehen, unkompliziert kleine Dinge zu 
erledigen und nicht als Datenbankersatz geeignet. Das war mir so nicht klar.


Ich gehe jetzt deinen einfachen Weg und freue mich, wie easy das geht.
Das bedeutet aber auch, dass die Tabellen nicht über Systeme hinweg 
funktionieren, außer ich setze die Sprache in den Einstellungen des 
Dokumentes fest. Die Tabellen gehen auch nicht mehr, wenn der Server die 
Datenstruktur ändert und das Tag-Flag auf einmal in D statt C steht.

Was ich auch noch feststellen musste: Zwischen meinen Rechnungen und der 
verlinkten Tabelle muss anscheinend zwingend eine Spalte frei bleiben, 
sonst sind nach der nächsten Aktualisierung alle meine Formeln weg.

> verlasse kurz D2 um die Formel zu übernehmen, markiere dann D2 wieder,
> halte den Cursor auf die rechte untere Ecke der Zelle das er zum Kreuz
> wird und führe dann einen Doppelklick aus, damit wird die Formel soweit
> nach unten kopiert wie es Werte in der Spalte C gibt.

Das funktioniert nicht, weil in der Spalte links neben der Formel ja nichts stehen darf.


>> und die Hilfe der Funktionen.
>>     
> die bordeigene Hilfe zu den Funktionen ist nicht so umfassend wie die
> von Excel, ist aber korrekt und zumindest nicht 'komisch' bzw. was meint
> "komisch".
>   
Die Beispiele sind recht dünn. Es fehlen größere Beispiele, die ganze 
Funktionskombinationen erklären. Da könnte ich viel für mich ableiten. 
Aber am meisten fehlt die Verlinkung thematisch zusammengehöriger 
Funktionen.

Bei den Tests bekam ich es mit einem weiteren Problem zu tun: Meine 
kleine Testtabelle mit 350 Zeilen und 50 Spalten überfordert meinen 
modernen Rechner völlig. OpenOffice belastet die CPU bei vielen Aktionen 
(z.B. Scrollen) über eine Minute. Hin und wieder stürzt es dabei ab.

Alles in allem sieht es auf den ersten Blick so aus, als wäre meine 
Aufgabe sehr leicht zu erledigen. Einige für mich unverständliche Hürden 
machen die Sache aber dennoch kompliziert. Ich würde mich freuen, wenn 
Du mir den vorgesehenen Calc-Weg erklären könntest.

Thomas




Mehr Informationen über die Mailingliste linux-l