<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>OpenDataCity &#124; Die DatengestalterOpenDataCity | Die Datengestalter - Datenjournalismus</title>
	<atom:link href="http://www.opendatacity.de/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.opendatacity.de</link>
	<description>Datenjournalismus</description>
	<lastBuildDate>Wed, 17 Apr 2013 09:40:14 +0000</lastBuildDate>
	<language>de-DE</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>Excel: Datensätze säubern, vereinheitlichen und automatisch ausfüllen</title>
		<link>http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/</link>
		<comments>http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/#comments</comments>
		<pubDate>Wed, 07 Nov 2012 16:11:32 +0000</pubDate>
		<dc:creator>maas</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Excel]]></category>
		<category><![CDATA[howto]]></category>
		<category><![CDATA[suchen&ersetzen]]></category>
		<category><![CDATA[Tutorial]]></category>
		<category><![CDATA[wenn]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=625</guid>
		<description><![CDATA[Ich hatte gestern einen Datensatz von Postleitzahlen und Gemeinden/Landkreisen/Städten (im Rohformat 8000 Zeilen) am Wickel, an dem ich einmal ein paar Aufräum-Arbeiten demonstrieren will &#8211; ich konnte so einer Kollegin mehrere Stunden Handarbeit sparen. Aufbau des Datensatzes (Beispiel-Datensatz) ist relativ simpel: PLZ; Stadt/Landkreis; Stadtteil/Gemeinde. Problematisch ist die letzte Spalte, in der die einzelnen Gemeinden mit [...]]]></description>
				<content:encoded><![CDATA[<p>Ich hatte gestern einen Datensatz von Postleitzahlen und Gemeinden/Landkreisen/Städten (im Rohformat 8000 Zeilen) am Wickel, an dem ich einmal ein paar Aufräum-Arbeiten demonstrieren will &#8211; ich konnte so einer Kollegin mehrere Stunden Handarbeit sparen.</p>
<p>Aufbau des Datensatzes (<a title="Datensatz PLZ" href="https://docs.google.com/spreadsheet/ccc?key=0ArUk2rWvU4rBdG5tajFUSWtZcXJ4bzBuM3I4dGRldlE#gid=0">Beispiel-Datensatz</a>) ist relativ simpel: PLZ; Stadt/Landkreis; Stadtteil/Gemeinde.</p>
<p><a href="http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/bildschirmfoto-2012-11-07-um-16-37-20/" rel="attachment wp-att-626"><img class="aligncenter size-large wp-image-626" title="Auszug Datensatz" src="http://www.opendatacity.de/wp-content/uploads/2012/11/Bildschirmfoto-2012-11-07-um-16.37.20-494x298.png" alt="" width="494" height="298" /></a></p>
<p>Problematisch ist die letzte Spalte, in der die einzelnen Gemeinden mit Semikolon getrennt für eine Stadt zusammengefasst sind. Ich will aber für jede Gemeinde eine vollständig ausgefüllte Zeile haben:</p>
<p><a href="http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/bildschirmfoto-2012-11-07-um-17-07-01/" rel="attachment wp-att-632"><img class="aligncenter size-full wp-image-632" title="Ziel-Auflistung" src="http://www.opendatacity.de/wp-content/uploads/2012/11/Bildschirmfoto-2012-11-07-um-17.07.01.png" alt="" width="286" height="178" /></a></p>
<p>Erster Schritt ist also, jeweils ein Semikolon durch eine neue Zeile zu ersetzen. Dafür markiere ich den entsprechenden Tabellenbereich und kopiere ihn in einen Texteditor und von dort nach Word (um Word daran zu hindern, aus der Zwischenablage ein echtes Tabellendokument zu machen).</p>
<p><a href="http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/bildschirmfoto-2012-11-07-um-16-47-11/" rel="attachment wp-att-627"><img class="aligncenter size-large wp-image-627" title="Word-Eingefügt" src="http://www.opendatacity.de/wp-content/uploads/2012/11/Bildschirmfoto-2012-11-07-um-16.47.11-494x243.png" alt="" width="494" height="243" /></a></p>
<p>Ich suche&amp;ersetze das Semikolon durch ein ^p (steht für Paragraph, also neuen Absatz &#8211; und rücke die einzelnen Gemeinden noch um zwei ^t (Tabularoren) ein:</p>
<p>Suche ; &#8211; ersetze das durch ^p^t^t</p>
<p><a href="http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/word/" rel="attachment wp-att-628"><img class="aligncenter size-large wp-image-628" title="Suchen &amp; Ersetzen" src="http://www.opendatacity.de/wp-content/uploads/2012/11/word-494x351.png" alt="" width="494" height="351" /></a></p>
<p>Wenn ich diesen Text jetzt zurück zu Excel kopiere, sieht er so aus (um die fehlende &#8220;0&#8243; am Anfang der PLZ kümmern wir uns später):</p>
<p><a href="http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/excel/" rel="attachment wp-att-629"><img class="aligncenter size-large wp-image-629" title="excel" src="http://www.opendatacity.de/wp-content/uploads/2012/11/excel-338x494.png" alt="" width="338" height="494" /></a></p>
<p>Jetzt hat der Datensatz insgesamt etwas über 14.000 Zeilen, die fehlenden Zellen händisch auszufüllen wäre utopisch, ich bediene mich hier einer einfachen WENN-Formel, in der ich Excel sage: Schaue nach,ob in der ersten Zelle etwas steht, wenn nicht, nimm den Inhalt der Zelle darüber und schreibe ihn in die leeren Felder. Sieht in Excel dann so aus:</p>
<p>=WENN(A3=0;E2;A3)</p>
<p><a href="http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/bildschirmfoto-2012-11-07-um-16-58-08/" rel="attachment wp-att-630"><img class="aligncenter size-large wp-image-630" title="wenn/dann" src="http://www.opendatacity.de/wp-content/uploads/2012/11/Bildschirmfoto-2012-11-07-um-16.58.08-494x89.png" alt="" width="494" height="89" /></a></p>
<p>Diese Formel muss ich dann nur noch bis zur letzten Zeile herunterziehen und habe einen bereinigten Datensatz. Excel ist sehr undankbar, was den Umgang mit Postleitzahlen angeht &#8211; im &#8220;Zellen formatieren&#8221; gibt es unter &#8220;Sonderformate&#8221; den Punkt &#8220;Postleitzahl D&#8221;, der mir die Zahlen dann in einem verwertbaren Format darstellt.</p>
<p><a href="http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/bildschirmfoto-2012-11-07-um-17-03-29/" rel="attachment wp-att-631"><img class="aligncenter size-large wp-image-631" title="Postleitzahlen-Formatierung" src="http://www.opendatacity.de/wp-content/uploads/2012/11/Bildschirmfoto-2012-11-07-um-17.03.29-494x488.png" alt="" width="494" height="488" /></a></p>
<p>Spart ne Menge Zeit&#8230;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/excel-datensatze-saubern-vereinheitlichen-und-automatisch-ausfullen/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>Datensatz: Steinbrücks Honorare 2010 bis 2012</title>
		<link>http://www.opendatacity.de/datensatz-steinbrucks-honorare-2010-bis-2012/</link>
		<comments>http://www.opendatacity.de/datensatz-steinbrucks-honorare-2010-bis-2012/#comments</comments>
		<pubDate>Tue, 30 Oct 2012 15:57:49 +0000</pubDate>
		<dc:creator>lorz</dc:creator>
				<category><![CDATA[Blog]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=603</guid>
		<description><![CDATA[Heute veröffentlichte Peer Steinbrück (SPD) die Höhe seiner Honorare und die Auftragsgeber für seine Vorträge. Wie nicht anders zu erwarten, wurden die Angaben feinsäuberlich als pdf-Dokument herausgegeben. Wir haben daraus einen Datensatz gemacht und daraus z.B. die Karte der Auftrittsorte oben generiert. Unten findet sich der Datensatz und ein Link auf ihn bei Google Docs. [...]]]></description>
				<content:encoded><![CDATA[<p><iframe src="https://www.google.com/fusiontables/embedviz?viz=MAP&amp;q=select+col9+from+1EeBdlfTQ_h4jUKthi2r44ufTPVQr7vGXkSsKkVw&amp;h=false&amp;lat=50.87531114220079&amp;lng=11.521281771875008&amp;z=6&amp;t=4&amp;l=col9&amp;y=2&amp;tmplt=2" frameborder="no" scrolling="no" width="650" height="570"></iframe></p>
<p>Heute <a href="http://blog.abgeordnetenwatch.de/2012/10/30/die-steinbruck-honorare-kurzanalyse/" target="_blank">veröffentlichte</a> Peer Steinbrück (SPD) die Höhe seiner Honorare und die Auftragsgeber für seine Vorträge. Wie nicht anders zu erwarten, wurden die Angaben feinsäuberlich als pdf-Dokument herausgegeben. Wir haben daraus einen Datensatz gemacht und daraus z.B. die Karte der Auftrittsorte oben generiert. Unten findet sich der Datensatz und ein Link auf ihn bei Google Docs.</p>
<p>Wie haben wir es gemacht? Per Adobe Acrobat das pdf als Excel gespeichert und durch einige Bearbeitungsschritte die Daten dann in die Spalten sortiert. Siehe dazu auch unser Excel-Tutorial <a href="http://www.opendatacity.de/tutorial-crashkurs-excel-fur-datenjournalismus/" target="_blank">hier im Blog</a>.</p>
<p><a href="http://blog.abgeordnetenwatch.de/wp-content/uploads/2012/10/Ver%C3%B6ff_Ergebnis.pdf.pdf" target="_blank">PDF zum Download</a> bei Abgeordnetenwatch</p>
<p>Gereinigter Datensatz <a href="https://docs.google.com/spreadsheet/ccc?key=0An0YnoiCbFHGdDdnb2VrRUw2MUFGaTBJamFQQkdvSGc" target="_blank">bei Google Docs</a> (OpenDataCity) &#8211; DIE DATEN WURDEN AUTOMATISIERT AUSGELESEN; KEINE GARANTIE AUF VOLLSTÄNDIG- UND RICHTIGKEIT.</p>
<p><script src="https://docs.google.com/spreadsheet/gpub?url=http%3A%2F%2Ftngmqk5kknht7idkbhrks3qtltpmeg9f-ss-opensocial.googleusercontent.com%2Fgadgets%2Fifr%3Fup_title%26up_showfilters%3D1%26up_enablegrouping%3D0%26up__table_query_url%3Dhttps%253A%252F%252Fdocs.google.com%252Fspreadsheet%252Ftq%253Frange%253DA1%25253AM89%2526gid%253D0%2526key%253D0An0YnoiCbFHGdDdnb2VrRUw2MUFGaTBJamFQQkdvSGc%2526pub%253D1%26url%3Dhttp%253A%252F%252Fwww.google.com%252Fig%252Fmodules%252Ftable.xml%26spreadsheets%3Dspreadsheets&#038;height=480&#038;width=650"></script></p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/datensatz-steinbrucks-honorare-2010-bis-2012/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Zwischenstand: GentriMap</title>
		<link>http://www.opendatacity.de/zwischenstand-gentrimap/</link>
		<comments>http://www.opendatacity.de/zwischenstand-gentrimap/#comments</comments>
		<pubDate>Mon, 24 Sep 2012 18:42:47 +0000</pubDate>
		<dc:creator>lorz</dc:creator>
				<category><![CDATA[Blog]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=585</guid>
		<description><![CDATA[Seit rund einem Jahr arbeiten wir zusammen mit der Humboldt-Uni in Berlin an einem Projekt &#8211; genauer gesagt mit den Stadtsoziologen dort, nämlich einem Team rund um Andrej Holm. Es geht um das Thema Gentrifizierung eben in Berlin. Also die Aufwertung von bestimmten Stadtgebieten durch Sanierung von Wohnraum bzw. dessen Umwandlung in Eigentum, der Auswechslung [...]]]></description>
				<content:encoded><![CDATA[<p><img class="size-full wp-image-591 alignright" title="gentrimap1a" src="http://www.opendatacity.de/wp-content/uploads/2012/09/gentrimap1a.jpg" alt="" width="400" height="1083" /></p>
<p>Seit rund einem Jahr arbeiten wir zusammen mit der Humboldt-Uni in Berlin an einem Projekt &#8211; genauer gesagt mit den Stadtsoziologen dort, nämlich einem Team rund um <a href="http://gentrificationblog.wordpress.com/" target="_blank">Andrej Holm</a>. Es geht um das Thema Gentrifizierung eben in Berlin. Also die Aufwertung von bestimmten Stadtgebieten durch Sanierung von Wohnraum bzw. dessen Umwandlung in Eigentum, der Auswechslung der Wohnbevölkerung, der Wandlung der Geschäftsstrukturen usw. usf. &#8211; Für dieses Vorhaben &#8220;<a href="http://gentrimap.net/" target="_blank">GentriMap</a>&#8221; wurden bisher die verschiedensten Datensätze aus Verwaltung, Privatwirtschaft und Forschung zusammengetragen. Seit einiger Zeit verschränken wir sie nun miteinander.</p>
<p>Die Hauptziele von GentriMap, wie es Andrej beschreibt: &#8220;Es geht darum, die Wissenslücke zwischen einerseits Maklern, Verwaltungsangestellten etc. und den Bewohnern anderseits zu schließen. Und darum, eine valide und datenbasierte empirische Evaluation städtischer Dynamiken zu liefern. Und so Kieze zu identifizieren, auf den der Druck von Gentrifizierung lastet.&#8221;</p>
<p>Michael, der unserseits für die Entwicklung des geplanten Onlinewerkzeug-Sets verantwortlich ist, spricht von diesem als &#8220;einem Teilchenbeschleuniger, mit dem jeder spielen darf&#8221;. Tatsächlich geht es um Werkzeuge, mit denen jeder sich Veränderungsprozesse in der Stadt Berlin auf einfache Weise betrachten und erforschen kann. Gleichzeitig sollen die Werkzeuge aber auch erlauben, dass Soziologen ihre Theorien mit ihm überprüfen können.</p>
<p>Rechts sind Grafiken aus einem ersten Prototypen zu sehen. Sie zeigen die Dichte der 25 bis 35-jährigen Wohnbevölkerung &#8211; je röter um so mehr, je blauer um so weniger. Was hier schon (wenig überraschend) deutlich wird: In der (östlichen) Mitte Berlins hat sich in den letzten knapp 20 Jahren die jüngere Bevölkerung konzentriert.</p>
<p>Neben einer interaktiven Karte werden als Werkzeuge auch Matrizen angeboten werden, die die Entwicklung der Stadtgebiete an verschiedenen Kriterien zeigt. Unsere Hoffnung (und Vermutung): Wir werden sehen können, dass neben Gebieten wie Nord-Neukölln es auch andere Gegenden in Berlin gibt, die unbeachtet von der (medialen) Öffentlichkeit durchaus als Gentrifizierungsgebiete gelten könnten. Und vielleicht werden Aussagen möglich, in welchen Gebieten es mit Gentrifizierung losgehen könnte.</p>
<p>Übrigens: Wir suchen noch einen Medienparrtner, der das Werkzeug gerne in einer datenjournalistischen  Variante auf seiner Website bringen will. Falls eine Redaktion Interesse hat &#8211; bitte mit uns in <a href="http://www.opendatacity.de/kontakt/" target="_blank">Kontakt treten</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/zwischenstand-gentrimap/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Tutorial: Crashkurs Excel für Datenjournalismus</title>
		<link>http://www.opendatacity.de/tutorial-crashkurs-excel-fur-datenjournalismus/</link>
		<comments>http://www.opendatacity.de/tutorial-crashkurs-excel-fur-datenjournalismus/#comments</comments>
		<pubDate>Thu, 09 Aug 2012 15:45:00 +0000</pubDate>
		<dc:creator>Michael</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Excel]]></category>
		<category><![CDATA[Tutorial]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=539</guid>
		<description><![CDATA[Microsoft Excel ist eigentlich nur ein Tabellenkalkulationsprogramm und genau so wird es meist auch nur verwendet. Excel ist aber in Wirklichkeit ein sehr, sehr mächtiges Werkzeug. Jede Datenjournalistin und jeder Datenjournalist sollte sich mit Excel wirklich sehr gut auskennen. Zum einen gibt es dafür viele Kurse und Anleitungen im Internet, aber es ist mindestens genau [...]]]></description>
				<content:encoded><![CDATA[<p>Microsoft Excel ist eigentlich nur ein Tabellenkalkulationsprogramm und genau so wird es meist auch nur verwendet.</p>
<p>Excel ist aber in Wirklichkeit ein sehr, sehr mächtiges Werkzeug. Jede Datenjournalistin und jeder Datenjournalist sollte sich mit Excel wirklich sehr gut auskennen. Zum einen gibt es dafür viele Kurse und Anleitungen im Internet, aber es ist mindestens genau so wichtig, sich gegenseitig über die Schulter zu schauen und neue Tricks zu zeigen. Selbst ich lerne nach 15 Jahren immer wieder neue Tricks in Excel kennen, die mir jemand zeigt oder auf die man zufällig stößt.</p>
<p>Die wichtigsten Dinge, was man in Excel kennen sollte, sind:</p>
<ul>
<li>die Excel-Funktionen</li>
<li>nutzbare Datenquellen</li>
<li>Ausgabemöglichkeiten</li>
</ul>
<p><strong>Excel-Funktionen</strong></p>
<p>Die Hilfe in Excel enthält eine Liste alle Excel-Funktionen gruppiert nach Themengebiete. Das sollte wenigstens mal durchgeblättert werden, um sich einen groben Überblick zu verschaffen.<br />
Die wichtigsten, die man auf jeden Fall kennen sollte, sind:</p>
<p>LÄNGE(Text)<br />
gibt die Länge des Textes zurück, also die Anzahl der Zeichen.<br />
LÄNGE(&#8220;Dingsbums &#8220;) = 9</p>
<p>LINKS(Text; Anzahl Zeichen)<br />
gibt die angegebene Anzahl von Zeichen von link zurück, also z.B. die ersten 5 Zeichen.<br />
LINKS(&#8220;Dingsbums&#8221;; 5) = &#8220;Dings&#8221;</p>
<p>RECHTS(Text; Anzahl Zeichen)<br />
gibt die angegebene Anzahl von Zeichen von rechts zurück, also z.B. die letzten 4.<br />
RECHTS(&#8220;Dingsbums&#8221;; 4) = &#8220;bums&#8221;</p>
<p>TEIL(Text; erstes Zeichen; Anzahl Zeichen)<br />
gibt die angegebene Anzahl von Zeichen aus der Mitte zurück, also z.B. 2 Zeichen ab dem 3.<br />
TEIL(&#8220;Dingsbums&#8221;; 2; 3) = &#8220;ing&#8221;</p>
<p>FINDEN(Suchtext; Text)<br />
sucht nach einem Text in einem anderen und gibt die Position zurück:<br />
FINDEN(&#8220;bum&#8221;; &#8220;Dingsbums&#8221;) = 6</p>
<p>WECHSELN(Text; alter Text; neuer Text)<br />
ersetzt innerhalb eines Textes alle Vorkommen von „alter Text“ durch „neuer Text“<br />
WECHSELN(&#8220;Dingsbums&#8221;; &#8220;s&#8221;; &#8220;el&#8221;) = &#8220;Dingelbumel&#8221;</p>
<p><span id="more-539"></span></p>
<p>Beispiel: Man hat die folgende Spalte</p>
<pre style="padding-left: 30px;">12345Berlin
22767Hamburg
10587Berlin
30519Hannover</pre>
<p>Mit der Funktion =LINKS(A1; 5) erhält man dann</p>
<pre style="padding-left: 30px;">12345
22767
10587
30519</pre>
<p>Bzw. mit der Funktion =TEIL(A1; 6; 1000) erhält man dann</p>
<pre style="padding-left: 30px;">Berlin
Hamburg
Berlin
Hannover</pre>
<p>Anmerkung: Der letzte Parameter von TEIL gibt an, wie viele Zeichen zurückgegeben werden sollen. Falls die Zahl größer ist, als der Text lang ist, werden so viele Zeichen zurückgegeben, wie möglich. Das bedeutet, wenn der letzte Parameter eine sehr große Zahl ist, also z.B. 1000, dann wird einfach nur der Rest des Textes zurückgegeben. Also TEIL(A1; 6; 1000) gibt den restlichen Text ab dem 6. Zeichen zurück.</p>
<p><strong>Nutzbare Datenquellen</strong></p>
<p>Üblicher Weise nutzt man in Excel nur Tabellen. Tatsächlich kann fast jedes strukturierte Textformat in Excel genutzt und verarbeitet werden. Eine oft übersehene Datenquelle ist z.B. die Kommandozeile.</p>
<p>In der Kommandozeile kann man sich beispielsweise alle Dateien in einem Verzeichnis ausgeben und in eine Datei schreiben lassen</p>
<pre style="padding-left: 30px;">Unter Mac/Linux: ls -1 &gt; list.txt
Unter Windows/DOS: dir /b &gt; list.txt</pre>
<p>Diese beiden Befehle erzeugen jeweils eine Textdatei mit einer Liste aller Dateien im aktuellen Verzeichnis. Z.B. ein Auszug aus der Liste aller Fotos, die ich mit meinem Handy geschossen habe:</p>
<pre style="padding-left: 30px;">2012-04-14 00.33.59.jpg
2012-04-14 00.34.03.jpg
2012-04-14 01.29.45.jpg
2012-04-17 01.07.10.png
2012-06-03 05.51.20.png</pre>
<p>Diese kann dann in Excel geöffnet werden, so dass man unter Excel die Dateinamen weiterverarbeiten kann.</p>
<p>Diese Dateiliste könnte man beispielsweise mit Excel weiterverarbeiten, so dass man in einer zweiten Spalte neue Dateinamen konstruiert. In diesem Fall habe ich mit den oben erwähnten Excel-Funktionen mal die Punkte in den Uhrzeiten durch Minuszeichen ersetzt:</p>
<pre style="padding-left: 30px;">2012-04-14 00-33-59.jpg
2012-04-14 00-34-03.jpg
2012-04-14 01-29-45.jpg
2012-04-17 01-07-10.png
2012-06-03 05-51-20.png</pre>
<p>Die Formel dazu lautet:</p>
<table border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top">
<pre style="font-size: 20px;">=</pre>
</td>
<td valign="top">
<pre style="font-size: 20px;">WECHSELN(</pre>
</td>
<td valign="top">
<pre style="font-size: 20px;">LINKS(A1;19)</pre>
</td>
<td valign="top">
<pre style="font-size: 20px;">;".";"-")</pre>
</td>
<td valign="top">
<pre style="font-size: 20px;">&amp;</pre>
</td>
<td valign="top">
<pre style="font-size: 20px;">RECHTS(A1;4)</pre>
</td>
</tr>
<tr>
<td></td>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;">
<p align="center">Nimmt die ersten<br />
19 Zeichen<br />
(nur Dateiname)</p>
</td>
<td></td>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;">
<p align="center">Nimmt die letzten<br />
4 Zeichen<br />
(z.B. &#8220;.jpg&#8221;)</p>
</td>
</tr>
<tr>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;" colspan="3">
<p align="center">Ersetzt alle Vorkommen von &#8220;.&#8221; mit &#8220;-&#8221;</p>
</td>
<td></td>
<td style="border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;"></td>
</tr>
<tr>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;" colspan="5">
<p align="center">Der Operator &#8220;&amp;&#8221; Setzt den neuen Dateinamen mit der Dateiendung zusammen.</p>
</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p><strong>Ausgabemöglichkeit: Konsole</strong></p>
<p>Nun haben wir eine Tabelle mit zwei Spalten:</p>
<pre style="padding-left: 30px;">Alter Dateiname           Neuer Dateiname
2012-04-14 00.33.59.jpg   2012-04-14 00-33-59.jpg
2012-04-14 00.34.03.jpg   2012-04-14 00-34-03.jpg
2012-04-14 01.29.45.jpg   2012-04-14 01-29-45.jpg
2012-04-17 01.07.10.png   2012-04-17 01-07-10.png
2012-06-03 05.51.20.png   2012-06-03 05-51-20.png</pre>
<p>Aus dieser Tabelle kann man wieder Kommandozeilen-Befehle erzeugen!</p>
<p>Z.B. die Umbenennung von Dateien macht man in der Kommandozeile mit:</p>
<pre>Unter Mac/Linux:   mv  "alter Name" "neuer Name"
Unter Windows/DOS: ren "alter Name" "neuer Name"</pre>
<p>Die Funktion, um daraus Windows/DOS-Befehle zum Umbenennen der Dateien zu erzeugen, könnte z.B. so aussehen:</p>
<table border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td>
<pre>=</pre>
</td>
<td>
<pre>"ren """</pre>
</td>
<td>
<pre>&amp;</pre>
</td>
<td style="text-align: center;" align="center">
<pre>A2</pre>
</td>
<td>
<pre>&amp;</pre>
</td>
<td>
<pre>""" """</pre>
</td>
<td>
<pre>&amp;</pre>
</td>
<td style="text-align: center;" align="center">
<pre>B2</pre>
</td>
<td>
<pre>&amp;</pre>
</td>
<td>
<pre>""""</pre>
</td>
</tr>
<tr>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;">
<p align="center">ren &#8220;</p>
</td>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;">
<p align="center">Alter Dateiname</p>
</td>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;">
<p align="center">&#8221; &#8220;</p>
</td>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;">
<p align="center">Neuer Dateiname</p>
</td>
<td></td>
<td style="padding: 3px; border-left: 1px solid #000; border-right: 1px solid #000; background-color: #eee;">
<p align="center">&#8220;</p>
</td>
</tr>
</tbody>
</table>
<p>Die Spalte mit den DOS-Befehlen sieht dann so aus:</p>
<pre style="padding-left: 30px;">ren "2012-04-14 00.33.59.jpg" "2012-04-14 00-33-59.jpg"
ren "2012-04-14 00.34.03.jpg" "2012-04-14 00-34-03.jpg"
ren "2012-04-14 01.29.45.jpg" "2012-04-14 01-29-45.jpg"
ren "2012-04-17 01.07.10.png" "2012-04-17 01-07-10.png"
ren "2012-06-03 05.51.20.png" "2012-06-03 05-51-20.png"</pre>
<p>Und jetzt kommt der Clou! Man kann die ganze Spalte kopieren und direkt in die Windows-DOS-Konsole einfügen &#8211; einfach copy&amp;paste. Damit werden alle Befehle ausgeführt und somit die Dateien umbenannt.</p>
<p>Das besondere daran: Es funktioniert mit beliebig vielen Dateien!</p>
<p>Es müssen 10.000 Dateien umbenannt und z.B. Punkte durch Minuszeichen ersetzt werden? Mit Excel und der Kommandozeilen machen Sie das in 5 Minuten!</p>
<p><strong>Ausgabemöglichkeit: HTML</strong></p>
<p>Mit der Formel:</p>
<pre style="padding-left: 30px;">="&lt;img src="""&amp;B2&amp;"""&gt;"</pre>
<p>kann man aus den Dateinamen HTML-Code erzeugen. Die Spalten könnten dann z.B. so aussehen:</p>
<pre style="padding-left: 30px;">Dateiname                   HTML
2012-04-14 00-33-59.jpg     &lt;img src="2012-04-14 00-33-59.jpg"&gt;
2012-04-14 00-34-03.jpg     &lt;img src="2012-04-14 00-34-03.jpg"&gt;
2012-04-14 01-29-45.jpg     &lt;img src="2012-04-14 01-29-45.jpg"&gt;
2012-04-17 01-07-10.png     &lt;img src="2012-04-17 01-07-10.png"&gt;
2012-06-03 05-51-20.png     &lt;img src="2012-06-03 05-51-20.png"&gt;</pre>
<p>Legt man nun in einem Texteditor eine HTML-Datei an und kopiert den erzeugten HTML-Code an die richtige Stelle, hat man eine Webseite erzeugt, die alle Dateien in einer Art Fotoalbum darstellt.</p>
<p><strong>Ausgabemöglichkeit: SVG</strong></p>
<p>SVG steht für Scalable Vector Graphics und ist ein Vektor-Grafik-Format, das man leicht beispielsweise mit aktuellen Browsern öffnen kann.</p>
<p>Zwei solcher SVG-Grafiken sind:</p>
<p><img class="alignright size-full wp-image-572" title="a" src="http://www.opendatacity.de/wp-content/uploads/2012/08/a.jpg" alt="" width="650" height="300" /></p>
<p><img class="size-full wp-image-571 alignleft" title="b" src="http://www.opendatacity.de/wp-content/uploads/2012/08/b.jpg" alt="" width="650" height="300" /><br />
(Beide Grafiken stammen aus dem Projekt für die taz: &#8220;<a href="http://www.opendatacity.de/portfolio/facebook-vs-europe/" target="_blank">Facebook vs Europe</a>&#8220;.)</p>
<p>Das besondere an diesen beiden SVG-Grafiken: Sie wurden mit Excel erstellt!</p>
<p>Ich will jetzt nicht zu tief in SVG einsteigen. Dafür kann man auch den guten Wikipedia-Artikel lesen: <a href="http://de.wikipedia.org/wiki/Scalable_Vector_Graphics">http://de.wikipedia.org/wiki/Scalable_Vector_Graphics</a></p>
<p>Aber ich will kurz den Schritt zeigen, wie man aus Excel-Daten die einzelnen Grafik-Elemente erzeugt.</p>
<p>In SVG definiert man Kreise mit:</p>
<pre style="padding-left: 30px;">&lt;circle cx='16.3515795' cy='48.2191556' r='0.02'/&gt;</pre>
<p>Wie man sieht, sind hier die x- und y-Koordinate des Mittelpunktes (cx, cy) angegeben, so wie der Radius des Kreises. Man kann gerne noch Füllfarbe, Kreisdicke, Transparenz etc. angeben. Die eigentlichen Werte wurden mit Excel berechnet und in der letzten Spalte daraus der entsprechende circle-Tag generiert.</p>
<p>Ganz ähnlich kann man so auch Rechtecke zeichnen, für die man vorher die Parameter berechnet:</p>
<pre style="padding-left: 30px;">&lt;rect x='16' y='11.61' width='1' height='-11.61' /&gt;</pre>
<p>Hat man die SVG-Elemente in Excel berechnet, kann man sie in eine SVG-Datei an die richtige Stelle kopieren und fertig ist die Grafik.</p>
<p><em>Dieser Text von Michael Kreil steht unter einer Creative Commons-Lizenz (CC BY 3.0 Michael Kreil)</em></p>
<p>[Siehe auch: Unser <a href="http://www.opendatacity.de/tutorial-erste-schritte-mit-regularen-ausdrucken/">Tutorial zu Regulären Ausdrücken, RegEX</a>)</p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/tutorial-crashkurs-excel-fur-datenjournalismus/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Tutorial: Erste Schritte mit regulären Ausdrücken</title>
		<link>http://www.opendatacity.de/tutorial-erste-schritte-mit-regularen-ausdrucken/</link>
		<comments>http://www.opendatacity.de/tutorial-erste-schritte-mit-regularen-ausdrucken/#comments</comments>
		<pubDate>Mon, 23 Jul 2012 16:43:20 +0000</pubDate>
		<dc:creator>Michael</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[RegEx]]></category>
		<category><![CDATA[Tutorial]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=508</guid>
		<description><![CDATA[Reguläre Ausdrücke  (regular expressions, RegExp, RegEx, Grep, &#8230;) Viele Aufgaben eines/r Datenjournalist/in kann man mit „Suchen und Ersetzen“ lösen, z.B. in Microsoft Word. Für komplexere „Suchen und Ersetzen“ gibt es die sogenannten „regulären Ausdrücke“. Diese werden von Microsoft Word leider nicht unterstützt, aber in vielen einfachen Texteditoren, wie z.B. in den kostenlosen OpenSource-Anwendungen TextWrangler für [...]]]></description>
				<content:encoded><![CDATA[<p><strong>Reguläre Ausdrücke  (regular expressions, RegExp, RegEx, Grep, &#8230;)</strong></p>
<p>Viele Aufgaben eines/r Datenjournalist/in kann man mit „Suchen und Ersetzen“ lösen, z.B. in Microsoft Word.</p>
<p>Für komplexere „Suchen und Ersetzen“ gibt es die sogenannten „regulären Ausdrücke“. Diese werden von Microsoft Word leider nicht unterstützt, aber in vielen einfachen Texteditoren, wie z.B. in den kostenlosen OpenSource-Anwendungen <a href="http://www.barebones.com/products/TextWrangler/" target="_blank">TextWrangler </a>für Mac oder <a href="http://notepad-plus-plus.org" target="_blank">Notepad++</a> für Windows.</p>
<p>Wie man mit „Suchen und Ersetzen“ einen Text bereinigen kann, werde ich nun an einem Beispiel demonstrieren. Dafür habe ich eine Liste gewählt, in der alle Leerzeichen fehlen. Diese Phänomen tritt in der Arbeit öfters auf, z.B. weil der Text mit einer OCR-Software (Bild-zu-Text-Erkennung) erstellt oder aus einem PDF-Dokument kopiert wurde. Hier ein Beispiel; die Liste der ehemaligen Bundespräsidenten der BRD kopiert von der <a href="http://de.wikipedia.org/wiki/Bundespr%C3%A4sident_(Deutschland)#Die_bisherigen_Bundespr.C3.A4sidenten_der_Bundesrepublik_Deutschland" target="_blank">entsprechenden Wikipedia Seite.</a></p>
<pre style="padding-left: 30px;"> TheodorHeuss(1884–1963)
 HeinrichLübke(1894–1972)
 GustavHeinemann(1899–1976)
 WalterScheel(*1919)
 KarlCarstens(1914–1992)
 RichardvonWeizsäcker(*1920)
 RomanHerzog(*1934)
 JohannesRau(1931–2006)
 HorstKöhler(*1943)
 ChristianWulff(*1959)
 JoachimGauck(*1940)</pre>
<p>&nbsp;</p>
<p>Als erstes kann man alle „(“ ersetzen durch ein Tab, dass von Excel als Spaltenwechsel interpretiert wird.</p>
<p>In Word: ersetze „(“ durch „^t“<br />
Als regulärer Ausdruck: ersetze „\(“ durch „\t“</p>
<pre style="padding-left: 30px;"> TheodorHeuss            1884–1963)
 HeinrichLübke           1894–1972)
 GustavHeinemann         1899–1976)
 WalterScheel            *1919)
 KarlCarstens            1914–1992)
 RichardvonWeizsäcker    *1920)
 RomanHerzog             *1934)
 JohannesRau             1931–2006)
 HorstKöhler             *1943)
 ChristianWulff          *1959)
 JoachimGauck            *1940</pre>
<p>&nbsp;</p>
<p>Nun die schließenden Klammern entfernen.</p>
<p>In Word: ersetze „)“ durch „“<br />
Als regulärer Ausdruck: ersetze „\)“ durch „“</p>
<pre style="padding-left: 30px;"> TheodorHeuss            1884–1963
 HeinrichLübke           1894–1972
 GustavHeinemann         1899–1976
 WalterScheel            *1919
 KarlCarstens            1914–1992
 RichardvonWeizsäcker    *1920
 RomanHerzog             *1934
 JohannesRau             1931–2006
 HorstKöhler             *1943
 ChristianWulff          *1959
 JoachimGauck            *1940</pre>
<p>&nbsp;</p>
<p>Nun die Minuszeichen durch einen Tab ersetzen.</p>
<p>In Word: ersetze „-“ durch „^t“<br />
Als regulärer Ausdruck: ersetze „\-“ durch „\t“</p>
<pre style="padding-left: 30px;"> TheodorHeuss            1884   1963
 HeinrichLübke           1894   1972
 GustavHeinemann         1899   1976
 WalterScheel            *1919
 KarlCarstens            1914   1992
 RichardvonWeizsäcker    *1920
 RomanHerzog             *1934
 JohannesRau             1931   2006
 HorstKöhler             *1943
 ChristianWulff          *1959
 JoachimGauck            *1940</pre>
<p>&nbsp;</p>
<p>Nun die Mal-Zeichen entfernen.</p>
<p>In Word: ersetze „*“ durch „“<br />
Als regulärer Ausdruck: ersetze „\*“ durch „“</p>
<pre style="padding-left: 30px;"> TheodorHeuss            1884   1963
 HeinrichLübke           1894   1972
 GustavHeinemann         1899   1976
 WalterScheel            1919
 KarlCarstens            1914   1992
 RichardvonWeizsäcker    1920
 RomanHerzog             1934
 JohannesRau             1931   2006
 HorstKöhler             1943
 ChristianWulff          1959
 JoachimGauck            1940</pre>
<p>&nbsp;</p>
<p>Die Daten sind nun schon sehr gut strukturiert, aber die Namen sind noch nicht korrekt. Vor- und Nachnamen „kleben“ noch aneinander. Man müsste nach jeden Kleinbuchstaben, auf den ein Großbuchstabe folgt, ein Leerzeichen setzen. Solch eine Aufgabe lässt sich nicht mehr mit einem einfachen „Suchen und Ersetzen“ lösen. Theoretisch müsste man jede Kombination von Klein- und Großbuchstaben suchen. Mit Microsoft Word kommt man hier nicht mehr weiter, aber mit regulären Ausdrücken.</p>
<p>Als regulärer Ausdruck: ersetze „([a-z])([A-Z])“ durch „\1 \2“</p>
<pre style="padding-left: 30px;"> Theodor Heuss           1884  1963
 Heinrich Lübke          1894  1972
 Gustav Heinemann        1899  1976
 Walter Scheel           1919
 Karl Carstens           1914  1992
 Richardvon Weizsäcker   1920
 Roman Herzog            1934
 Johannes Rau            1931  2006
 Horst Köhler            1943
 Christian Wulff         1959
 Joachim Gauck           1940</pre>
<p>&nbsp;</p>
<p>Durch den oben verwendeten regulären Ausdruck werden beliebige Kombinationen aus Klein- und Großbuchstaben gefunden:</p>
<table border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td>
<p style="text-align: right;"><strong>&nbsp; &nbsp; (</strong></p>
</td>
<td>
<p align="center"><strong>[a-z]</strong></p>
</td>
<td>
<p style="text-align: left;"><strong>) &nbsp; &nbsp;</strong></p>
</td>
<td>
<p style="text-align: right;"><strong>&nbsp; &nbsp; (</strong></p>
</td>
<td>
<p align="center"><strong>[A-Z]</strong></p>
</td>
<td>
<p style="text-align: left;"><strong>) &nbsp; &nbsp;</strong></p>
</td>
</tr>
<tr>
<td valign="top"></td>
<td valign="top">
<p align="center">ein beliebiger<br />
Kleinbuchstabe</p>
</td>
<td valign="top"></td>
<td valign="top"></td>
<td valign="top">
<p align="center">ein beliebiger<br />
Großbuchstabe</p>
</td>
<td valign="top"></td>
</tr>
<tr>
<td colspan="3" valign="top">
<p align="center"> 1. Teil in Klammern</p>
</td>
<td colspan="3" valign="top">
<p align="center"> 2. Teil in Klammern</p>
</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p>Wenn etwas gefunden wird, wird es ersetzt durch:</p>
<table border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top">
<p style="text-align: center;" align="right"><strong>\1</strong></p>
</td>
<td style="text-align: center;" valign="top"></td>
<td style="text-align: center;" valign="top"><strong>\2</strong></td>
</tr>
<tr>
<td>
<p align="center">Was im 1. Teil in<br />
Klammern gefunden wurde.</p>
</td>
<td>
<p align="center"> Leerzeichen</p>
</td>
<td>
<p align="center">   Was im 2. Teil in<br />
Klammern gefunden wurde.</p>
</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p>Reguläre Ausdrücke sind scheinbar kompliziert, aber auch hier ist alles eine Frage der Übung! Wenn man einmal damit anfängt, hat man schnell die ersten Erfolgserlebnisse und lernt dann kontinuierlich weitere Tricks dazu. Aber den ersten Schritt muss man erst einmal machen, und zwar einfach mal nach „Regulären Ausrücken“ googeln und sich die vielen Einführungskurse anschauen, <a href="http://www.danielfett.de/internet-und-opensource,artikel,regulaere-ausdruecke" target="_blank">etwa diesen hier</a>.</p>
<p>Hier ein paar weitere Beispiele:</p>
<p>So findet man in einem Text automatisch Internet-Adressen aus Deutschland</p>
<table border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top">
<p align="center"><strong>http\:\/\/</strong></p>
</td>
<td valign="top">
<p align="center"><strong>[a-z0-9\-\.]+</strong></p>
</td>
<td valign="top">
<p align="center"><strong>\.de</strong></p>
</td>
</tr>
<tr>
<td>
<p align="center">http:\\</p>
</td>
<td>
<p align="center">    Beliebige Kombination aus Kleinbuchstaben,<br />
Zahlen, Minuszeichen und Punkten</p>
</td>
<td>
<p align="center">.de</p>
</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p>So findet man in einem Text automatisch E-Mail-Adressen</p>
<table border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top">
<p style="text-align: center;" align="center"><strong>[a-z0-9\-\.]+</strong></p>
</td>
<td style="text-align: center;" valign="top">
<p style="text-align: left;" align="center"><strong>       \@       </strong></p>
</td>
<td valign="top">
<p style="text-align: center;" align="center"><strong>[a-z0-9\-\.]+</strong></p>
</td>
</tr>
<tr>
<td>
<p align="center">Beliebige Kombination aus<br />
Kleinbuchstaben, Zahlen,<br />
Minuszeichen und Punkten</p>
</td>
<td>
<p style="text-align: left;" align="center">       @</p>
</td>
<td>
<p align="center">Beliebige Kombination aus<br />
Kleinbuchstaben, Zahlen,<br />
Minuszeichen und Punkten</p>
</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p>So findet man automatisch 4- und 5-stellige Zahlen, z.B. Postleitzahlen</p>
<table border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top">
<p style="text-align: center;" align="center"><strong>\s</strong></p>
</td>
<td style="text-align: center;" valign="top">
<p align="center"><strong>[0-9]</strong></p>
</td>
<td style="text-align: center;" valign="top">
<p align="center"><strong>{4,5}</strong></p>
</td>
<td valign="top">
<p style="text-align: center;" align="center"><strong>\s</strong></p>
</td>
</tr>
<tr>
<td>
<p align="center"> Leerzeichen</p>
</td>
<td>
<p align="center"> eine beliebige Ziffer</p>
</td>
<td>
<p align="center">&#8230; und zwar eine Kombination<br />
aus mindestens 4 und maximal 5</p>
</td>
<td>
<p align="center"> Leerzeichen</p>
</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p><em>Dieser Text von Michael Kreil steht unter einer Creative Commons-Lizenz (CC BY 3.0 Michael Kreil)</em></p>
<p>[Siehe auch: Unser <a href="http://www.opendatacity.de/tutorial-crashkurs-excel-fur-datenjournalismus/">Tutorial zu Excel</a>)</p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/tutorial-erste-schritte-mit-regularen-ausdrucken/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Farmsubsidy.org &amp; OpenDataCity join forces for the Knight News Challenge</title>
		<link>http://www.opendatacity.de/farmsubsidy-org-opendatacity-join-forces-for-the-knight-news-challenge/</link>
		<comments>http://www.opendatacity.de/farmsubsidy-org-opendatacity-join-forces-for-the-knight-news-challenge/#comments</comments>
		<pubDate>Thu, 21 Jun 2012 07:04:35 +0000</pubDate>
		<dc:creator>lorz</dc:creator>
				<category><![CDATA[Blog]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=501</guid>
		<description><![CDATA[Who are the beneficiaries of the almost €60 billion annual EU subsidies to farmers and the agro-industry? Since 2004 the farmsubsidy.org team has been working to obtain data about the beneficiaries and make them accessible to the European public. But making 12 GB of data accessible in a meaningful way needs more than award winning [...]]]></description>
				<content:encoded><![CDATA[<p><img class="alignleft" src="https://twimg0-a.akamaihd.net/profile_images/202211794/cow_logo_square_reasonably_small.gif" alt="" width="128" height="128" />Who are the beneficiaries of the almost €60 billion annual EU subsidies to farmers and the agro-industry? Since 2004 the farmsubsidy.org team has been working to obtain data about the beneficiaries and make them accessible to the European public. But making 12 GB of data accessible in a meaningful way needs more than award winning journalists and excellent analysts.</p>
<p>So now <a href="www.farmsubsidy.org" target="_blank">Farmsubsidy.org</a> joins forces with OpenDataCity a German award winning datajournalism team. OpenDataCity specialises in data-storytelling based upon large datasets.</p>
<p>Together we have given <a href="http://newschallenge.tumblr.com/post/25546323692/farmsubsidy-reloaded-and-an-eu-transparency-tool" target="_blank">our bid for the Knight Challenge</a>. We intend to develop a tool which makes the Farmsubsidy datasets &#8211; 12 years and 27 countries &#8211; easily searchable and visible. This will become an EU Transparency Tool which also will be available for other large datasets concerning EU data, such as the structural funds, fisheries subsidies, R&amp;D subsidies and so on.</p>
<p>Please support <a href="http://newschallenge.tumblr.com/post/25546323692/farmsubsidy-reloaded-and-an-eu-transparency-tool" target="_blank">our application here</a>.</p>
<p>&#8212;</p>
<p>Background:</p>
<p>Farmsubsidy.org was founded in 2005 by journalists Brigitte Alfter and Nils Mulvad and political analyst <a href="http://jackthurston.com/about/" target="_blank">Jack Thurston</a>. The common aim was to shed light on the beneficiaries of the EU agricultural policy. For decades this policy had been carried out under the same aim written up in the after-war years and without the public being able to follow how it actually functioned.</p>
<p>Since the first data sets were made available in 2004 and the following years, the public debate could focus on the actual money flows rather than just political speeches. <a href="http://www.farmsubsidy.org/news/media/" target="_blank">Numerous media reports</a> and several books on the subject have used Farmsubsidy data.</p>
<p>Read more on OpenDataCity <a href="http://www.opendatacity.de/our-stories-come-as-code/">here</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/farmsubsidy-org-opendatacity-join-forces-for-the-knight-news-challenge/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Prototyp S- und U-Bahnmonitor Berlin</title>
		<link>http://www.opendatacity.de/prototyp-s-und-u-bahnmonitor-berlin/</link>
		<comments>http://www.opendatacity.de/prototyp-s-und-u-bahnmonitor-berlin/#comments</comments>
		<pubDate>Wed, 06 Jun 2012 14:24:53 +0000</pubDate>
		<dc:creator>lorz</dc:creator>
				<category><![CDATA[Blog]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=489</guid>
		<description><![CDATA[Heute am 6.6.2012 ging der 2. Berliner Open Data Day (BODDy) über die Bühne. Das Thema fasst erfreulicherweise langsam aber sicher Fuß in Berlin. Um den Komplex anschaulich zu machen, haben wir uns gestern ein paar Stunden Zeit genommen und den Zugmonitor recycelt. Prototypisch zeigen wir die meisten S- und U-Bahnzüge in Berlin, wie sie [...]]]></description>
				<content:encoded><![CDATA[<p style="text-align: center;"><a href="http://www.opendatacity.de/labs/sbahnberlin/prototyp/app.html"><img class="size-full wp-image-493" title="usbahn2" src="http://www.opendatacity.de/wp-content/uploads/2012/06/usbahn2.png" alt="" width="640" height="364" /></a></p>
<p>Heute am 6.6.2012 ging der 2. Berliner Open Data Day (<a href="http://berlin.opendataday.de/berliner-open-data-day/boddy-2012/" target="_blank">BODDy</a>) über die Bühne. Das Thema fasst erfreulicherweise langsam aber sicher Fuß in Berlin. Um den Komplex anschaulich zu machen, haben wir uns gestern ein paar Stunden Zeit genommen und den Zugmonitor recycelt. Prototypisch zeigen wir die meisten S- und U-Bahnzüge in Berlin, wie sie laut Fahrplan am 5.6.2012 gefahren sind (keine Live-Daten, keine Verspätungen).</p>
<p><a href="http://www.opendatacity.de/labs/sbahnberlin/prototyp/app.html" target="_blank">Die Anwendung findet sich hier.</a> Bitte in einem neueren Browser öffnen (Firefox, Chrome, Safari), etwas Geduld haben und wenn etwas hakt: bitte die Seite neu laden.</p>
<p>Wir denken, dass mit ÖPNV-Daten &#8211; stünden sie als Open Data (Fahrplan, Positionen etc.) zur Verfügung &#8211; enorm interessante Dinge geschehen könnten. Unser Prototyp soll eine Ahnung davon vermitteln.Wir freuen uns über Feedback (info-at-opendatacity.de).</p>
<p>Viel Dank geht an Sven K. und Michael K. für ihren Einsatz gestern.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/prototyp-s-und-u-bahnmonitor-berlin/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Wir sind zweimal für den Grimme Online Award 2012 nominiert</title>
		<link>http://www.opendatacity.de/wir-sind-zweimal-fur-den-grimme-online-award-2012-nominiert/</link>
		<comments>http://www.opendatacity.de/wir-sind-zweimal-fur-den-grimme-online-award-2012-nominiert/#comments</comments>
		<pubDate>Tue, 08 May 2012 09:14:46 +0000</pubDate>
		<dc:creator>lorz</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[GOA]]></category>
		<category><![CDATA[Grimme Online Award]]></category>
		<category><![CDATA[parteispenden]]></category>
		<category><![CDATA[taz]]></category>
		<category><![CDATA[ui]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=437</guid>
		<description><![CDATA[Heute wurden in Düsseldorf die Nominierungen für den Grimme Online Award 2012 bekannt gegeben. OpenDataCity ist gleich zweimal dabei: Einmal zusammen mit der taz für die Parteispendenanwendungen (s.u.). Und zum zweiten zusammen mit süddeutsche.de für den Zugmonitor - beidesmal in der Kategorie &#8220;Wissen &#38; Bildung&#8221;. Wir sind begeistert &#8211; durch die zweifache Nominierung fühlen wir uns [...]]]></description>
				<content:encoded><![CDATA[<p><img class="size-medium wp-image-455 alignleft" title="nominiert_2012_gross" src="http://www.opendatacity.de/wp-content/uploads/2012/05/nominiert_2012_gross-188x134.gif" alt="" width="150" />Heute wurden in Düsseldorf die Nominierungen für den <a href="http://www.grimme-institut.de/html/index.php?id=1569" target="_blank">Grimme Online Award 2012</a> bekannt gegeben. OpenDataCity ist gleich zweimal dabei: Einmal zusammen mit der <em>taz</em> für die<a href="http://www.opendatacity.de/portfolio/parteispenden/"> Parteispendenanwendungen</a> (s.u.). Und zum zweiten zusammen mit <em>süddeutsche.de</em> für den <a href="http://www.opendatacity.de/portfolio/zugmonitor/">Zugmonitor</a> - beidesmal in der Kategorie &#8220;Wissen &amp; Bildung&#8221;.</p>
<p>Wir sind begeistert &#8211; durch die zweifache Nominierung fühlen wir uns bestätigt: Datenjournalismus ist gekommen, um zu bleiben. Bereits vergangenes Jahr wurden wir mit <em>Zeit Online</em> zusammen für die <a title="Vorratsdaten" href="http://www.opendatacity.de/portfolio/vorratsdaten/">Vorratsdatenanwendung</a> ausgezeichnet.</p>
<p><a href="http://www.opendatacity.de/wp-content/uploads/2012/05/parteispenden_vergleich_version.jpg"><img class="size-large wp-image-438 alignright" title="parteispenden_vergleich_version" src="http://www.opendatacity.de/wp-content/uploads/2012/05/parteispenden_vergleich_version-328x494.jpg" alt="" width="328" height="494" /></a>Übrigens haben wir vor kurzem für die Parteispendenanwendungen (<a href="http://taz.de/Parteispenden-Watch/!t200/" target="_blank">Karte</a> &amp; <a href="http://taz.de/Parteispenden-Watch/!t200/#parteispenden-recherche" target="_blank">Recherchetool</a>) bei der<em> taz</em> die Daten für 2010 eingepflegt. Nachgeschoben haben wir jetzt auch noch eine überarbeitete Fassung der Karte. Zum einem haben wir das Farbschema überholt, aber auch die Tabs (Reiter) oben umstrukturiert, um die Daten übersichtlicher zugänglich zu machen. <a href="http://www.opendatacity.de/wp-content/uploads/2012/05/parteispenden_vergleich_version.jpg" target="_blank">Hier gibt es </a>ein großes Bild des rechtsstehenden Vergleichs.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/wir-sind-zweimal-fur-den-grimme-online-award-2012-nominiert/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Interview zum Zugmonitor auf der re:publica 12</title>
		<link>http://www.opendatacity.de/interview-zum-zugmonitor-auf-der-republica-12/</link>
		<comments>http://www.opendatacity.de/interview-zum-zugmonitor-auf-der-republica-12/#comments</comments>
		<pubDate>Mon, 07 May 2012 08:16:06 +0000</pubDate>
		<dc:creator>lorz</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[rp12]]></category>
		<category><![CDATA[video]]></category>
		<category><![CDATA[Zugmonitor]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=431</guid>
		<description><![CDATA[Zweiter Tag der re:publica Netzkonferenz 2012 in Berlin: Philip Banse interviewte für dctp.tv Stefan Plöchinger (süddeutsche.de) und Lorenz Matzat (OpenDataCity) rund 20 Minuten zum Zugmonitor. Es ging darum, wie das Projekt zustande kam und wie es bei der SZ implementiert wurde. Link zum Beitrag bei dctp.tv]]></description>
				<content:encoded><![CDATA[<p><iframe width="580" scrolling="no" height="340" frameborder="0" src="http://www.dctp.tv/filme/republica12-matzat-ploechinger/embed/" name="dctp-embed" marginwidth="0" marginheight="0"><br /></iframe></p>
<p>Zweiter Tag der re:publica Netzkonferenz 2012 in Berlin: Philip Banse interviewte für dctp.tv Stefan Plöchinger (süddeutsche.de) und Lorenz Matzat (OpenDataCity) rund 20 Minuten zum Zugmonitor. Es ging darum, wie das Projekt zustande kam und wie es bei der SZ implementiert wurde.</p>
<p><a href="http://www.dctp.tv/filme/republica12-matzat-ploechinger/" target="_blank">Link</a> zum Beitrag bei dctp.tv</p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/interview-zum-zugmonitor-auf-der-republica-12/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Newthinking und OpenDataCity vereinbaren Zusammenarbeit</title>
		<link>http://www.opendatacity.de/newthinking-und-opendatacity-vereinbaren-zusammenarbeit/</link>
		<comments>http://www.opendatacity.de/newthinking-und-opendatacity-vereinbaren-zusammenarbeit/#comments</comments>
		<pubDate>Wed, 02 May 2012 06:47:35 +0000</pubDate>
		<dc:creator>lorz</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Business]]></category>
		<category><![CDATA[Kooperation]]></category>
		<category><![CDATA[newthinking]]></category>

		<guid isPermaLink="false">http://www.opendatacity.de/?p=381</guid>
		<description><![CDATA[Seit einiger Zeit waren wir in Gesprächen mit newthinking. Die Agentur aus Berlin, die die re:publica mit ausrichtet und aus deren Dunstkreis auch netzpolitik.org kommt, sind für uns Wunschpartner. Deswegen freuen wir uns, dass wir dieser Tage eine weitreichende Zusammenarbeit vereinbart haben. So liest sich das bei newthinking: Kooperation Open Data City und newthinking haben eine [...]]]></description>
				<content:encoded><![CDATA[<p><img class="size-large wp-image-359 alignleft" title="nt-Logo_einzeilig" src="http://www.opendatacity.de/wp-content/uploads/2012/04/nt-Logo_einzeilig-494x147.png" alt="" width="294" />Seit einiger Zeit waren wir in Gesprächen mit <em><a href="http://newthinking.de/" target="_blank">newthinking</a></em>. Die Agentur aus Berlin, die die <em>re:publica</em> mit ausrichtet und aus deren Dunstkreis auch <em>netzpolitik.org</em> kommt, sind für uns Wunschpartner.</p>
<p>Deswegen freuen wir uns, dass wir dieser Tage eine weitreichende Zusammenarbeit vereinbart haben. So liest sich das <a href="http://newthinking.de/2012/04/30/die-republica-2012-ist-das-highlight-im-newthinking-kalender/" target="_blank">bei <em>newthinking</em></a>:</p>
<p><strong>Kooperation</strong></p>
<p><strong><a href="http://www.opendatacity.de/" target="_blank">Open Data City</a></strong> und newthinking haben eine weit reichende Partnerschaft vereinbart. Beide Unternehmen erweitern durch diese gemeinsame, strategische Kooperation ihr Produktportfolio und vergrößern somit ihre Reichweite.<br />
<em>“Durch diese Kooperation erweitern wir unser Produktportfolio und vergrößern somit die Reichweite.<br />
Mit Open Data City und newthinking ist man gewappnet für große Datensätze (Big Data) und Daten der öffentlichen Hand (Open Data). Unsere Expertise und innovative Herangehensweisen bündeln wir gern – zum Vorteil unserer Kunden und Partner</em>“, sagte heute Lorenz Matzat (Open Data City).</p>
<p>Open Data City ist eine Agentur für Datenvisualisierung mit den Schwerpunkten Beratung, Schulung und Data Intelligence. Bekannte Projekte von Open Data City sind zum Beispiel der Zugmonitor oder die Fluglärmkarte BBI.<em><a href="http://www.opendatacity.de/" target="_blank">www.opendatacity.de</a></em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.opendatacity.de/newthinking-und-opendatacity-vereinbaren-zusammenarbeit/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
<!-- This Quick Cache file was built for (  www.opendatacity.de/feed/ ) in 0.52740 seconds, on May 23rd, 2013 at 10:00 pm UTC. -->
<!-- This Quick Cache file will automatically expire ( and be re-built automatically ) on May 23rd, 2013 at 11:00 pm UTC -->
<!-- +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ -->
<!-- Quick Cache Is Fully Functional :-) ... A Quick Cache file was just served for (  www.opendatacity.de/feed/ ) in 0.00047 seconds, on May 23rd, 2013 at 10:23 pm UTC. -->