Bridging uncertain and ambiguous knowledge with imprecise probabilities

Bridging uncertain and ambiguous knowledge with imprecise probabilities

  • Simon L. Rinderknechta, b, Corresponding author contact information,
  • Mark E. Borsukc,
  • Peter Reicherta, b, E-mail the corresponding author
  • a Eawag, Swiss Federal Institute of Aquatic Science and Technology, Department of Systems Analysis, Integrated Assessment and Modelling, CH-8600 Dübendorf, Switzerland
  • b ETH Zurich, Department of Environmental Sciences, Institute of Biogeochemistry and Pollutant Dynamics (IBP), CH-8092 Zürich, Switzerland
  • c Dartmouth College, Thayer School of Engineering, Hanover, NH 03755-8000, USA
  • Received 31 July 2010. Revised 25 July 2011. Accepted 27 July 2011. Available online 13 September 2011.

View full text


Abstract

Model-based environmental decision support requires that uncertainty be rigorously evaluated. Whether uncertainty is aleatory or epistemic, we argue that probability is the natural mathematical construct for describing uncertainty in predictions used for decision-making. If expert knowledge is elicited using stated preferences between lotteries, and the experts are rational in the sense of avoiding sure loss, then the resulting knowledge quantifications will be consistent with the axiomatic foundation of probability theory. This idea can be extended to the description of intersubjective knowledge when the intent is to characterize the state of knowledge of the scientific community. Many methods for probability elicitation have been reported, but there is nearly always some degree of ambiguity in translating elicited quantities into probabilistic description. This would include: any lack of fit of a particular distributional form to elicited data; incertitude in the elicited data themselves; and/or disagreement in the elicited data across multiple experts. By replacing a precise probability distribution by a set of distributions, the mathematical concept of imprecise probabilities provides a means for representing this ambiguity. In this way, imprecise probabilities can form a bridge between total ignorance and precisely characterized risk by allowing for a continuous degree of imprecision to represent ambiguity. We introduce three metrics to describe the relative ambiguity of important attributes of probability distributions, namely their width, shape, and mode. These metrics are applicable to sets of distributions characterized by using any available method, and we derive the specific forms of these metrics for the Density Ratio Class, which we have found to have many desirable properties. Based on these metrics and on elicitation data from the literature, we use three examples to demonstrate the wide variety of ambiguity that can be present in elicited knowledge. Imprecise probabilities allow us to quantify this ambiguity and consider it in environmental decision-making. Our examples were implemented using a package we recently developed and made freely available for the R statistical programming environment.

Keywords

  • Expert elicitation;
  • Subjective probabilities;
  • Intersubjective knowledge;
  • Interval probabilities;
  • Qualitative expertise;
  • Quantitative expertise;
  • Robust Bayesian inference;
  • Robust Bayesian statistics;
  • Quantile elicitation;
  • Imprecise probabilities;
  • Probability box;
  • Quantile class;
  • Density Ratio Class

“Le Paradoxe de Bertrand” in Deutsch: Das Bertrand-Paradoxon

Gallery

This gallery contains 4 photos.

Das Bertrand-Paradoxon stammt aus der Wahrscheinlichkeitstheorie. Es verdeutlicht, dass reine Intuition in dieser Disziplin manchmal sehr irreführend ist und zu total verschiedenen Resultaten führen kann. Das Problem wurde erstmals im Jahre 1888 von Joseph Bertrand in seinem Buch “Calcul des … Continue reading

Find the Wrong Mistake.

Gallery

This gallery contains 27 photos.

Vor ein paar Jahren musste ich eine Klasse prüfen – als Stellvertreter. Und das ging so richtig schief. So schief, dass es für sich schon fast wieder gerade steht. Anyway, Mathematik ist eine experimentelle Wissenschaft, deren Experimente psychologischer Natur sind. … Continue reading

Harmonics | Sonderwoche

Gallery

This gallery contains 3 photos.

Ideenskript: Naturtonreihe_September_06 [pdf, 174KB ] Anbei der LaTeX-Skript %https://blogs.ethz.ch/rindi % *************************** \documentclass[smallheadings,headsepline,12pt,a4paper]{scrartcl} \usepackage[ngerman,french]{babel} \usepackage[applemac]{inputenc} % teilt LaTeX die Texcodierung mit. Bei Windowssystemen: ansinew \usepackage[T1]{fontenc} \usepackage{hyperref} \usepackage[pdftex]{graphicx} \typearea{12} \pagestyle{headings} \clubpenalty = 10000 \widowpenalty = 10000 \selectlanguage{ngerman} \begin{document} \titlehead{ \hfill Ort der … Continue reading

Skript | Sonderwoche | Deskriptive Statistik

Skript einer Sonderwoche: Deskriptive_Statistik_Skript_08 [pdf, 660KB]

Anbei die Version in LaTeX:

% Diese Vorlage wurde unter anderem von Simon Berwert erstellt.
% Infos zu LaTeX: http://unimac.switch.ch/services/latex/index.de.html
% A. PR{\”{a}}AMBEL https://blogs.ethz.ch/rindi/
% ***********************************************

\documentclass[smallheadings,headsepline,12pt,a4paper]{scrreprt}
\usepackage[ngerman]{babel}
\usepackage[applemac]{inputenc} % teilt LaTeX die Texcodierung mit. Bei Windowssystemen: ansinew
\usepackage[T1]{fontenc}
\usepackage{hyperref}
\usepackage{graphics,wrapfig,times}
\usepackage[T1]{fontenc}
\usepackage{txfonts}
\usepackage{hyperref}
\usepackage{marvosym}
\usepackage[pdftex]{graphicx}
\usepackage{multicol}
\usepackage{color}
\usepackage[dvips]{geometry}
\typearea{12} \pagestyle{headings}
\clubpenalty = 10000
\widowpenalty = 10000

\begin{document}

% B. TITELSEITE UND INHALTSVERZEICHNIS https://blogs.ethz.ch/rindi/
% ***********************************************

\titlehead{Kantonsschule XY
\hfill HS~2008\\
Abteilung Mathematik\\
Strasse 99\\
9999 G{\”{u}}gglialp}
\subject{Sonderwoche}
\title{Deskriptive Statistik}
\author{Simon-Lukas.Rinderknecht@gmx.ch}

\maketitle
\tableofcontents

% C. HAUPTTEIL https://blogs.ethz.ch/rindi/
% ***********************************************

\chapter{Einf{\”{u}}hrung}
\section{Etymologie (Herkunft des Wortes \emph{Statistik})}

Das Wort Statistik stammt vom lateinischen „\emph{statisticum}“ („den Staat betreffend“). Die deutsche Statistik, eingef{\”{u}}hrt von Gottfried Achenwall (1749), bezeichnete urspr{\”{u}}nglich die Lehre von den Daten {\”{u}}ber den Staat, also Staatstheorie. Im 19. Jahrhundert hatte der Engl{\”{a}}nder Sir John Sinclair das Wort erstmals in seiner heutigen Bedeutung des allgemeinen Sammelns und Auswertens von Daten benutzt.

\section{Ein {\”{u}}berblick}
Von Statistiken wird gefordert, dass sie „objektiv“ (unabh{\”{a}}ngig vom Standpunkt des Statistikerstellers), „reliabel“ (verl{\”{a}}sslich), „valide“ ({\”{u}}berkontextuell g{\”{u}}ltig), „signifikant“ (bedeutend) und „relevant“ (wichtig) sind.\\

Die Statistik wird in die folgenden drei Teilbereiche eingeteilt:
\begin{description}
\item[Deskriptive Statistik:] Die \emph{deskriptive} Statistik (auch beschreibende Statistik oder empirische Statistik): mit der vorliegende Daten in geeigneter Weise beschrieben und zusammengefasst werden. Mit ihren Methoden verdichtet man quantitative Daten zu Tabellen, graphischen Darstellungen und Kennzahlen. Bei einigen Institutionen, z. B. dem Bundesamt f{\”{u}}r Statistik in Neuchâtel (BFU), ist die Erstellung solcher Statistiken die Hauptaufgabe.
\item[Induktive Statistik:] Die \emph{induktive} Statistik (auch mathematische Statistik, schließende Statistik oder Inferenzstatistik): In der induktiven Statistik leitet man aus den Daten einer Stichprobe Eigenschaften einer Grundgesamtheit ab. Die Wahrscheinlichkeitstheorie liefert die Grundlagen f{\”{u}}r die erforderlichen Sch{\”{a}}tz- und Testverfahren.
\item[Explorative Statistik:] Die \emph{explorative} Statistik (hypothesen-generierende Statistik, Datensch{\”{u}}rfung (data mining)): Methodisch eine Zwischenform der beiden vorgenannten Teilbereiche, bekommt als Anwendungsform jedoch zunehmend eine eigenst{\”{a}}ndige Bedeutung. Mittels deskriptiver Verfahren und induktiver Test-Methoden sucht sie systematisch m{\”{o}}gliche Zusammenh{\”{a}}nge (oder Unterschiede) zwischen Daten in vorhandenen Datenbest{\”{a}}nden und will sie zugleich in ihrer St{\”{a}}rke und Ergebnissicherheit bewerten. Die so gefundenen Ergebnisse lassen sich als Hypothesen verstehen, die erst, nachdem darauf aufbauende, induktive Testverfahren mit entsprechenden (prospektiven) Versuchsplanungen sie best{\”{a}}tigten, als statistisch gesichert gelten k{\”{o}}nnen.
\end{description}

Gemeinsam mit der Wahrscheinlichkeitstheorie definiert die mathematische Statistik das mathematische Teilgebiet der Stochastik.
\section{NZZ-Folio Leitartikel: Wieso haben reiche M{\”{a}}nner wenig Haare auf dem Kopf? Wie viele Schweizer gehen zur Kirche? Was ist das geometrische Mittel?}
Aus NZZ Folio 01/06
\subsection{Mittelwert und Streuung}

Ein Schweizer isst zwei Dutzend Cervelas im Jahr. Nat{\”{u}}rlich nur im Durchschnitt {\”{u}}ber alle B{\”{u}}rger des Landes, und damit sind wir schon mitten in der Statistik: Viele Schweizer essen {\”{u}}berhaupt keine Cervelas, andere k{\”{o}}nnen nie genug davon bekommen. In der Summe ergibt das 160 Millionen. Diese Summe, geteilt durch die Zahl der Summanden, heisst auch arithmetisches Mittel; das ist f{\”{u}}r viele der Inbegriff von Durchschnitt {\”{u}}berhaupt.\\

F{\”{u}}r die meisten Zwecke reicht diese Art von Durchschnitt v{\”{o}}llig aus. Aber zuweilen kann das arithmetische Mittel auch in die Irre f{\”{u}}hren: Angenommen, wir geben einem Verm{\”{o}}gensverwalter 100 000 Franken. Nach einem Jahr werden daraus 160 000 Franken – ein Plus von 60 Prozent. Das Jahr darauf f{\”{a}}llt unser Verm{\”{o}}gen auf 80 000 Franken – ein Minus von 50 Prozent. Das arithmetische Mittel der beiden Renditen von einmal +60 und einmal –50 Prozent ist (+60 – 50) : 2 = + 5 Prozent. Anders gesagt: Wir haben am Ende weniger als am Anfang, aber im Durchschnitt nimmt der Wert unseres Verm{\”{o}}gens in jeder Periode zu!\\

Profis wissen nat{\”{u}}rlich, dass man Wachstumsraten niemals arithmetisch mitteln darf. Der korrekte Durchschnitt ist hier jene j{\”{a}}hrliche Rendite, die in zwei Jahren aus 100 000 Franken 80 000 Franken macht, das sind (leicht gerundet) – 10,55 Prozent: Nach einem Jahr werden so aus den anf{\”{a}}nglichen 100 000 Franken damit 10,55 Prozent weniger, das sind 89 450 Franken, das n{\”{a}}chste Jahr werden aus diesen 89 450 Franken nochmals 10,55 Prozent weniger, das sind dann (bis auf Rundungsfehler) 80 000 Franken. Diese Durchschnittsrendite von – 10,55 Prozent findet man {\”{u}}ber das geometrische Mittel der beiden sogenannten Wachstumsfaktoren 1,6 und 0,5. Es wird errechnet, indem man die Wurzel aus 1,6 x 0,5 = 0,8 zieht, das ergibt 0,8945. Von diesem geometrischen Mittel der Wachstumsfaktoren ist dann noch 1 abzuziehen: 0,8945 – 1 = – 0, 1 055.\\

Regelm{\”{a}}ssige Proteste ruft das arithmetische Mittel bei Meldungen der Art hervor, dass etwa niedergelassene {\”{a}}rzte in der Schweiz im Jahr im Durchschnitt 205 000 Franken Einkommen erzielen. «Stimmt {\”{u}}berhaupt nicht, viel zu hoch!» h{\”{o}}rt man dann {\”{a}}rztefunktion{\”{a}}re klagen. «Drei Viertel aller {\”{a}}rzte verdienen weniger, der Durchschnitt betr{\”{a}}gt nur 165 000 Franken!» Das ist auch so, nur haben diese Kritiker nochmals einen anderen Durchschnitt im Sinn, den sogenannten Zentralwert oder Median. Der Median ist der Wert, der in der Mitte steht, wenn man alle Einkommen der Gr{\”{o}}sse nach sortiert. Bei drei Einkommen 1,3 und 8 ist der Zentralwert 3, das arithmetische Mittel aber gr{\”{o}}sser, n{\”{a}}mlich 4, und das ist typisch f{\”{u}}r Merkmale wie Einkommen, Verm{\”{o}}gen oder Grundbesitz, wo oft einige wenige sehr viel mehr haben als alle anderen. Hier liegt der Median in aller Regel unter dem arithmetischen Mittel; er ist unempfindlich gegen hohe Werte am rechten Rand, die wie ein Magnet das arithmetische Mittel nach oben ziehen. Statistiker sagen dazu auch «robust».\\

Und oft blenden nat{\”{u}}rlich Durchschnitte wichtige Informationen einfach aus: Wenn ich im Durchschnitt jeden Tag des Monats einen Viertel Rotwein trinke, aber alle am gleichen Tag, bekomme ich eine Alkoholvergiftung und bin tot. Trinke ich dagegen jeden Tag nur einen, lebe ich sogar l{\”{a}}nger als Leute, die nie Rotwein trinken. Der Durchschnitt ist in beiden F{\”{a}}llen gleich, aber die Abweichung vom Durchschnitt ist im ersten Fall erheblich gr{\”{o}}sser. Deshalb f{\”{u}}gt man Durchschnitten am besten immer auch ein Mass f{\”{u}}r die Abweichung vom Durchschnitt bei, wie die Schwankungsbreite oder die Standardabweichung.\\

Die Schwankungsbreite ist einfach der Abstand zwischen dem gr{\”{o}}ssten und dem kleinsten Wert; die Standardabweichung ist die «durchschnittliche» Abweichung vom Durchschnitt. Bei sogenannten normalverteilten Daten liegen 95 Prozent der F{\”{a}}lle weniger als zwei Standardabweichungen vom arithmetischen Mittel entfernt. Wenn man S{\”{a}}tze h{\”{o}}rt wie «Ein erwachsener Mitteleurop{\”{a}}er hat einen IQ von 100 + / – 15», so ist in aller Regel das damit gemeint. «Normalverteilt» soll dabei heissen, dass sich sehr vieles – fr{\”{u}}her glaubte man sogar: fast alles –, was sich auf dieser Erde messen oder wiegen l{\”{a}}sst, auf eine ganz bestimmte Weise um den Durchschnitt streut: Die Masse dr{\”{a}}ngt sich dicht darum herum, aber mit wachsender Entfernung nimmt die H{\”{a}}ufigkeit der Werte dann glockenf{\”{o}}rmig ab.\\

\subsection{Korrelation und Kausalit{\”{a}}t }

Oft ist bei den Objekten einer Untersuchung mehr als nur eine einzige Variable von Interesse: bei Immobilien die Lage, die Gr{\”{o}}sse und der Preis; bei Partnerschaftsinseraten in der NZZ das Geschlecht, das Alter, die K{\”{o}}rpergr{\”{o}}sse, der Beruf; bei Patienten in der Klinik der Blutdruck und die Dosis eines blutdrucksenkenden Medikaments. Da w{\”{u}}sste man oft gerne: h{\”{a}}ngen diese Variablen zusammen – und wenn ja, wie? Das f{\”{u}}hrt in den Bereich der modernen Statistik, der sich mit Abh{\”{a}}ngigkeiten – sogenannten Korrelationen – und Kausalbeziehungen befasst.\\

Die Grafik «Korrelation und Kausalit{\”{a}}t» stellt die Lebenserwartung der M{\”{a}}nner und das durchschnittliche Pro-Kopf-Einkommen in 25 Schweizer Kantonen einander gegen{\”{u}}ber. Zus{\”{a}}tzlich sind auch noch die beiden arithmetischen Mittelwerte eingetragen. Basel-Stadt ist nicht dabei, weil die Menschen dort zwar viel verdienen (im Durchschnitt 99 000 Franken j{\”{a}}hrlich, das ist Landesrekord), aber dennoch fr{\”{u}}her sterben als in den meisten anderen Kantonen. Solche Datenpunkte, die sich von allen anderen drastisch unterscheiden, heissen Ausreisser; die behandelt man besser getrennt (wobei wir das Spekulieren {\”{u}}ber diesen Ausreisser hier den Soziologen und Demographen {\”{u}}berlassen wollen).\\

Im Grossen und Ganzen leben M{\”{a}}nner in Kantonen mit hohem Durchschnittseinkommen l{\”{a}}nger (Punkte in der Grafik oben rechts); M{\”{a}}nner in Kantonen mit tiefem Durchschnittseinkommen sterben fr{\”{u}}her (Punkte in der Grafik unten links). Dies ist ein Beispiel f{\”{u}}r eine positive Korrelation: je mehr vom einen, desto mehr auch vom andern. Eine negative Korrelation dagegen bedeutet: je mehr vom einen, desto weniger vom andern. (Je mehr Regenschirme verkauft werden, desto weniger Sonnencrème wird abgesetzt.) Das Mass der Abh{\”{a}}ngigkeit von zwei Variablen (Durchschnittseinkommen / Lebenserwartung) ist der sogenannte Korrelationskoeffizient. Er liegt zwischen minus eins (maximale negative Korrelation) und plus eins (maximale positive Korrelation) und dr{\”{u}}ckt aus, wie sicher man zum Beispiel vom Durchschnittseinkommen auf die Lebenserwartung schliessen kann. In unserem Beispiel hat der Korrelationskoeffizient den Wert 0,49.\\

Oft wird aus einer positiven oder negativen Korrelation auf eine positive oder negative Kausalbeziehung geschlossen. Das ist nicht immer richtig. Es gibt zum Beispiel bei erwachsenen M{\”{a}}nnern eine bemerkenswerte negative Korrelation zwischen dem Einkommen und der Zahl der Haare auf dem Kopf. Aber weder sind die Haare f{\”{u}}r das Einkommen noch ist das Einkommen f{\”{u}}r die Haare verantwortlich zu machen – diese negative Korrelation kommt dadurch zustande, dass beide Variablen von einer dritten Variablen, dem Lebensalter, abh{\”{a}}ngen: mit wachsendem Alter nimmt das Einkommen zu, und die Haare fallen aus. Bei der Interpretation von Korrelationen ist also immer darauf zu achten, dass man keine dritte, eigentlich kausale Variable {\”{u}}bersieht.\\

\begin{figure}[h!]
\centering
\includegraphics[width=14.5cm]{folio.pdf}
\end{figure}

\subsection{Stichproben und Umfragen }

Bevor man Mittelwerte, Standardabweichungen oder Korrelationskoeffizienten ausrechnet, muss man die Daten nat{\”{u}}rlich erst einmal haben. Daf{\”{u}}r behilft man sich oft mit Stichproben; sie reichen f{\”{u}}r viele Zwecke v{\”{o}}llig aus. Wie bei einer Polizeikontrolle, wo man aus einer winzigen Stichprobe unseres Blutes den gesamten Alkoholanteil problemlos abliest, l{\”{a}}sst sich auch aus einer Stichprobe von 1000 oder 2000 befragten B{\”{u}}rgern recht pr{\”{a}}zise hochrechnen, wie viele Schweizer insgesamt einen EU-Beitritt ablehnen oder sonntags in die Kirche gehen.\\

Vorausgesetzt, die Grundgesamtheit, aus der die Stichprobe kommt, wird wie ein Kartenspiel oder der Inhalt einer Urne vorher gut gemischt. Unser Blut besorgt dieses Mischen mit Hilfe physikalisch-chemischer Gesetze von allein. Bei der Bev{\”{o}}lkerung der Schweiz wird das Durchmischen nur simuliert. Das Standardverfahren daf{\”{u}}r ist eine sogenannte einfache Zufallsstichprobe: alle Schweizer haben die gleiche Chance, in die Stichprobe zu kommen. Wir verteilen quasi Nummern, f{\”{u}}r jeden erwachsenen Schweizer B{\”{u}}rger eine, notieren diese Nummer auf einer Lottokugel, legen die Kugeln in eine grosse Urne, sch{\”{u}}tteln kr{\”{a}}ftig und ziehen tausend Kugeln zuf{\”{a}}llig heraus. Aufgrund dieser Stichprobe wissen wir mit grosser Zuverl{\”{a}}ssigkeit, welcher Anteil der erwachsenen Schweizer nicht in die EU will oder sonntags in die Kirche geht.\\

In der Praxis kann man nat{\”{u}}rlich nur versuchen, diesem Ideal des Ziehens aus einer Urne m{\”{o}}glichst nahe zu kommen. Die Repr{\”{a}}sentativit{\”{a}}t der Stichprobe l{\”{a}}sst sich verbessern, wenn man getrennte Urnen f{\”{u}}r M{\”{a}}nner und Frauen oder f{\”{u}}r die B{\”{u}}rger verschiedener Kantone vorsieht. Solche «geschichteten» Stichproben garantieren, dass die landesweiten Geschlechter- oder kantonalen Proportionen in der Stichprobe erhalten bleiben. Bei einfachen Zufallsstichproben ist das nicht notwendig der Fall.\\

Abweichungen von diesem zentralen Zufallsprinzip f{\”{u}}hren zu verzerrten Stichproben – mit zuweilen desastr{\”{o}}sen Folgen. Man stelle sich vor, wir fragten zum Sonntagskirchgang nur die Teilnehmer des Hochamts in der Z{\”{u}}rcher Liebfrauenkirche. Dann w{\”{u}}rden hochgerechnet vielleicht 90 Prozent aller Schweizer regelm{\”{a}}ssig sonntags in die Kirche gehen. Die bisher gr{\”{o}}sste derartige Pleite widerfuhr der amerikanischen Wochenzeitschrift «Literary Digest» im Jahr 1936: Sie hatte vor der Pr{\”{a}}sidentenwahl mehrere Millionen US-B{\”{u}}rger befragt (eine nach heutigen Massst{\”{a}}ben gewaltige Stichprobe), wen sie zu w{\”{a}}hlen ged{\”{a}}chten. Es siegte mit grossem Vorsprung der Republikaner Landon. Die Wahl gewann jedoch Roosevelt mit {\”{u}}ber 60 Prozent der Stimmen. Warum die Fehlprognose? Die Stichprobe war aus Telefonregistern und Fahrzeugzulassungen gezogen worden – die meisten W{\”{a}}hler Roosevelts hatten damals aber weder ein Auto noch ein Telefon.\\

Zus{\”{a}}tzliche Verzerrungen drohen ferner immer dann, wenn man die gew{\”{u}}nschten Informationen nicht wie die K{\”{o}}rpergr{\”{o}}sse oder den Stromverbrauch einfach misst oder abliest, sondern erfragt. Aus den USA weiss man, dass m{\”{u}}ndliche Interviews zu den Themen Abtreibung, Todesstrafe oder Sozialhilfe andere Ergebnisse haben, je nachdem, ob der Interviewer ein Schwarzer oder ein Weisser ist. Auch die Reihenfolge der Fragen und nat{\”{u}}rlich die konkrete Formulierung sind f{\”{u}}r das Ergebnis von erheblicher Bedeutung. So fragte etwa die Forscherin Elisabeth Noelle-Neumann einmal eine repr{\”{a}}sentative Stichprobe von Arbeitern: «Finden Sie, dass in einem Betrieb alle Arbeiter in der Gewerkschaft sein sollten?» Resultat: daf{\”{u}}r 44 Prozent; dagegen 20 Prozent; unentschieden 36 Prozent.\\

Dann legte sie einer anderen, gleich grossen und ebenfalls repr{\”{a}}sentativen Stichprobe die gleiche Frage vor, nur mit der Erg{\”{a}}nzung «…oder muss man es jedem einzelnen {\”{u}}berlassen, ob er in der Gewerkschaft sein will oder nicht?». Ergebnis: daf{\”{u}}r 24 Prozent; selbst {\”{u}}berlassen 70 Prozent; unentschieden 6 Prozent. Der scheinbar unschuldige Zusatz halbiert die Anh{\”{a}}ngerschaft der Gewerkschaften von 44 auf nur noch 24 Prozent; zugleich l{\”{a}}sst er die Gegner von 20 auf 70 Prozent anwachsen – eine mehr als dreifach gr{\”{o}}ssere Opposition nur wegen eines kleinen Nebensatzes.\\

Einen grossen Unterschied macht es auch, ob man etwas «verbieten» oder «nicht erlauben» soll. 54 Prozent der Befragten in einer amerikanischen Umfrage meinten, dass die USA {\”{o}}ffentliche Angriffe auf die Demokratie verbieten sollten. Erheblich mehr, n{\”{a}}mlich 75 Prozent, waren der Meinung, die USA sollten {\”{o}}ffentliche Angriffe auf die Demokratie nicht erlauben.\\

Diese Abh{\”{a}}ngigkeit der Ergebnisse von der Art der Fragestellung l{\”{a}}dt nat{\”{u}}rlich zur bewussten Irref{\”{u}}hrung ein. Nach einer Umfrage einer deutschen Gewerkschaft lehnen 95 Prozent der bundesdeutschen Arbeitnehmer das Arbeiten am Samstag ab. Nach einer zeitgleichen Umfrage eines eher unternehmernahen Instituts dagegen sind 72 Prozent aller Arbeitnehmer auch zum Arbeiten am Wochenende bereit. Der Widerspruch erkl{\”{a}}rt sich durch die jeweiligen Fragebogen. «Votum f{\”{u}}r das freie Wochenende» steht bei der Gewerkschaft in grossen Lettern obenan. Es folgt eine lange Erl{\”{a}}uterung der M{\”{u}}hen, die das Durchsetzen der 5-Tage-Woche die Gewerkschaften gekostet habe, und eine Aufz{\”{a}}hlung aller Vorteile, die der freie Samstag f{\”{u}}r die Familie, die Gesellschaft, den Frieden und die Menschheitszukunft bringe, die dann zu der eigentlichen Frage {\”{u}}berleitet: «Was entspricht Deiner/Ihrer Meinung? (I) Nach meiner Ansicht w{\”{a}}re die Abschaffung des freien Wochenendes ein schwerer Schlag f{\”{u}}r Familie, Freundschaften, Partnerschaften, f{\”{u}}r Geselligkeit, Vereine, den Sport und das Kulturleben; (II) Ich halte den gemeinsamen Freizeitraum des Wochenendes f{\”{u}}r nicht so wichtig; (III) Weiss nicht / keine Angabe.» Dass hier fast alle wie gew{\”{u}}nscht die erste Antwort w{\”{a}}hlen, sollte niemanden erstaunen.\\

Genauso suggestiv, wenn auch mit umgekehrter Absicht, fragte das Unternehmerinstitut. Auf die Frage: «Inwieweit w{\”{a}}ren Sie bereit, samstags zu arbeiten, wenn es f{\”{u}}r die wirtschaftliche Situation Ihres Unternehmens gut w{\”{a}}re?» bietet es folgende Auswahlm{\”{o}}glichkeiten an: (I) gelegentlich, wenn daf{\”{u}}r an einem anderen Tag arbeitsfrei ist; (II) h{\”{a}}ufiger, wenn daf{\”{u}}r ein Zusatzurlaub herauskommt; (III) abwechselnd und (IV) nicht bereit. Auch hier waren die wenigen Kreuze bei «nicht bereit» schon im Fragebogen und in der Art der Fragen angelegt. Solche Umfragen, ob von einem Automobilclub zum Thema Tempolimit, ob von Greenpeace zum Atomausstieg oder von der katholischen Kirche zur Frage der Abtreibung, bel{\”{u}}gen uns in aller Regel {\”{u}}ber die wahre Meinung der befragten Menschen.\\

\subsection{Was heisst eigentlich «signifikant»?}

Zur{\”{u}}ck zu unserem Ausgangspunkt, dem Cervelas. Im Sommer 2005 liess NZZ-Folio zehn Sorten dieser Wurst von vier Pr{\”{u}}fern auf einer Skala von 1 bis 20 benoten; das Ergebnis war im Heft 7/2005 zu lesen. Der beste Cervelas erreichte im Durchschnitt {\”{u}}ber alle Pr{\”{u}}fer 15,5 Punkte, der schlechteste 12,75. Aber ist der am schlechtesten bewertete Cervelas auch wirklich schlechter? Oder k{\”{o}}nnen solche Unterschiede auch zuf{\”{a}}llig zustande kommen? Schliesslich schmeckt ja auch ein und derselbe Cervelas nicht jedem Pr{\”{u}}fer immer gleich, seine Bewertungen weichen zuf{\”{a}}llig, aufgrund der Reihenfolge der Verkostung, aufgrund von unterschiedlichem Appetit und Dutzenden weiterer Faktoren, von der f{\”{u}}r ihn «wahren» Note mehr oder weniger nach oben und nach unten ab.\\

Nehmen wir also einmal an, alle Cervelas w{\”{a}}ren von der gleichen Qualit{\”{a}}t; jeder Pr{\”{u}}fer h{\”{a}}tte f{\”{u}}r diese Qualit{\”{a}}t seine eigene «wahre» Bewertung, der Pr{\”{u}}fer A zum Beispiel 13,5; diese Note w{\”{a}}re bei Pr{\”{u}}fer A f{\”{u}}r alle W{\”{u}}rste gleich und nur durch eine Zufallskomponente {\”{u}}berlagert. Dann l{\”{a}}sst sich mit einigen Rechenregeln zu Wahrscheinlichkeiten zeigen, dass in der Tat das in NZZ-Folio 7/2005 gemeldete Ergebnis auch durch reinen Zufall erkl{\”{a}}rt werden k{\”{o}}nnte. Oder in der Sprache der Statistik: Die beobachteten Unterschiede sind nicht signifikant.\\

Signifikant dagegen heisst: Ein in den Daten sichtbares Muster ist nur schwer durch Zufall zu erkl{\”{a}}ren. Also, so der Umkehrschluss, steckt ein System dahinter. «Nur schwer durch Zufall zu erkl{\”{a}}ren» meint dabei im Allgemeinen: Wenn wirklich nur der Zufall wirken w{\”{u}}rde, h{\”{a}}tte das beobachtete Muster eine Wahrscheinlichkeit von h{\”{o}}chstens 5 Prozent. (Diese Grenze, auch Signifikanzniveau genannt, ist nat{\”{u}}rlich willk{\”{u}}rlich, wenn auch in den meisten Wissenschaften {\”{u}}blich. Mit dem gleichen Recht k{\”{o}}nnte man auch 1 Prozent oder 10 Prozent verwenden.)\\

Diese heute in allen Wissenschaften {\”{u}}bliche Methode zur Trennung von Zufall und System hat aber einen grossen und auch von den Wissenschaftern gern {\”{u}}bersehenen Pferdefuss: Die statistischen Verfahren zur Trennung von Zufall und System zeigen selbst bei Abwesenheit jedes systematischen Einflusses in immerhin 5 Prozent der F{\”{a}}lle dennoch eine Signifikanz an – so sind die Verfahren ja gerade konstruiert. Auch wissenschaftliche Fachzeitschriften und ihre Herausgeber vergessen das nur allzu gerne.\\

Und so k{\”{o}}nnen wir dann in den Medien lesen, dass neun Monate nach einem Stromausfall in X dort die Geburten angestiegen sind, dass Katholiken d{\”{u}}mmer sind als Protestanten, dass Knoblauchesser l{\”{a}}nger leben, dass Manager lieber Fluggesellschaft A als B benutzen, dass die Todesstrafe abschreckt, dass die Todesstrafe nicht abschreckt (je nach Weltanschauung), dass Schwarze krimineller sind als Weisse, dass Chemiefabriken (Starkstromleitungen, M{\”{u}}ll deponien) Leuk{\”{a}}mie erzeugen. Selbstverst{\”{a}}ndlich alles wissenschaftlich abgesichert und hoch signifikant.\\

Wir lesen jedoch nicht, wie viele andere Studien und Stichproben ohne signifikante Resultate es ausserdem gegeben hat. Wir lesen nicht, in wie vielen Studien Katholiken genauso klug sind wie Protestanten oder Manager lieber Fluglinie B als Linie A benutzen oder Industriebetriebe keine Leuk{\”{a}}mie erzeugen. Und ehe wir das nicht wissen, l{\”{a}}sst sich auch die wahre Bedeutung der angeblich so signifikanten Resultate nicht ermessen.\\

Walter Kr{\”{a}}mer ist Professor f{\”{u}}r Wirtschafts- und Sozialstatistik an der Universit{\”{a}}t Dortmund. Zu seinen popul{\”{a}}ren B{\”{u}}chern geh{\”{o}}ren «So l{\”{u}}gt man mit Statistik» und «Statistik verstehen: eine Gebrauchsanweisung» (beide als Taschenbuch bei Piper).\\

\chapter{Mittelwerte}
Mittelwerte treten in der Mathematik und insbesondere in der Statistik in inhaltlich unterschiedlichen Kontexten auf. In der Statistik ist ein Mittelwert ein sog. \emph{Lageparameter}, also ein aggregierender Parameter einer Verteilung, einer Stichprobe oder Grundgesamtheit. Ziel solcher aggregierender Parameter ist es, die wesentliche Information in einer l{\”{a}}ngeren Reihe von (z. B.) Messdaten in wenigen Daten zu konzentrieren. In der Mathematik treten Mittelwerte, insbesondere die drei klassischen Mittelwerte (Arithmetisches, Geometrisches und Harmonisches Mittel) bereits in der Antike auf. Pappos von Alexandria kennzeichnet 10 verschiedene Mittelwerte m von 2 Zahlen $a$ und $b$ $(a < b)$ durch spezielle Werte des Streckenverh{\”{a}}ltnisses $(b – m)/(m – a)$. Auch die Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel ist in der Antike bereits bekannt und geometrisch interpretiert.

Spezifisch f{\”{u}}r nimmers{\”{a}}ttliche Alleswisser: Im 19. und 20. Jahrhundert spielen Mittelwerte in der Analysis eine spezielle Rolle, dort im wesentlichen im Zusammenhang mit ber{\”{u}}hmten Ungleichungen und wichtigen Funktionseigenschaften wie Konvexit{\”{a}}t (H{\”{o}}lder-Ungleichung, Minkowski-Ungleichung, Jensensche Ungleichung usw.). Dabei wurden die klassischen Mittelwerte in mehreren Schritten verallgemeinert, zun{\”{a}}chst zu den Potenzmittelwerten und diese wiederum zu den quasi-arithmetischen Mittelwerten. Die klassische Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel geht dabei {\”{u}}ber in allgemeinere Ungleichungen zwischen Potenzmittelwerten bzw. quasi-arithmetischen Mittelwerten.\\

Im Folgenden seien $x_{1}, …, x_{n}$ gegebene reelle Zahlen, in der Statistik etwa Messwerte, deren Mittelwert berechnet werden soll.

\section{Arithmetisches Mittel}
\subsection{Definition}
Das arithmetische Mittel (auch Durchschnitt) ist ein rechnerisch bestimmter Mittelwert. Es ist so definiert:
\begin{equation}
\label{arithm}
\displaystyle
\bar{x}_{arithm}=\frac{1}{n}\sum_{i=1}^{n} x_{i}=\frac{x_{1}+x_{2}+…+x_{n}}{n}
\end{equation}
\subsection{Anwendungsbeispiel}
Ein Auto f{\”{a}}hrt eine Stunde lang $100$ km/h und die darauf folgende Stunde $200$ km/h. Mit welcher konstanten Geschwindigkeit muss ein anderes Auto fahren, um denselben Weg ebenfalls in $2$ Stunden zur{\”{u}}ckzulegen? (Rechne – wer kann! Antwort: $15$ km/h)
\subsection{Spezialfall: Gewichtetes arithmetisches Mittel}
Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte $x_i$,  aus n Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumf{\”{a}}ngen wi miteinander kombinieren will:
\begin{equation}
\displaystyle
\label{gewartithm}
\bar{x}_{gewarithm}=\frac{\sum_{i=1}^{n} \omega_{i} x_{i}}{\sum_{i=1}^{n} \omega_{i}}
\end{equation}
Beispiel: Ein Sch{\”{u}}ler erarbeitet sich folgende Noten: $\{6,5,4,6,5.5\}$. Die $4$ ist eine Streichnote und die $5$ z{\”{a}}hlt nur halb. Wie gross sind die Gewichtungen der Noten numerisch? Was ist die Schlussnote?
\section{Geometrisches Mittel}
\subsection{Definition}
Das geometrische Mittel ist die n-te Wurzel aus dem Produkt der positiven Zahlen $x_{1}, …, x_{n}$.
\begin{equation}
\displaystyle
\label{geom}
\bar{x}_{geom}=\sqrt[n]{\prod_{i=1}^{n} x_{i}}=\sqrt[n]{x_{1}\cdot x_{2}\cdot…\cdot x_{n}}
\end{equation}
Es ist in der Statistik ein geeignetes Lagemaß f{\”{u}}r Gr{\”{o}}ßen, von denen das Produkt anstelle der Summe interpretierbar ist, z. B. von Verh{\”{a}}ltnissen oder Wachstumsraten.
\subsection{Anwendungsbeispiel}
Ein Guthaben G wird im ersten Jahr mit zwei Prozent, im zweiten Jahr mit sieben und im dritten Jahr mit f{\”{u}}nf Prozent verzinst. Welcher {\”{u}}ber die drei Jahre konstante Zinssatz p h{\”{a}}tte zum Schluss das gleiche Kapital ergeben?\\

Guthaben $G_{Ende}$ am Ende des dritten Jahres:
\begin{displaymath}
\displaystyle
G_{Ende}=\Bigg(1+\frac{2}{100}\Bigg)\Bigg(1+\frac{7}{100}\Bigg)\Bigg(1+\frac{5}{100}\Bigg)G
\end{displaymath}
oder mit Zinsfaktoren geschrieben
\begin{displaymath}
G_{Ende}=1.2 \cdot 1.7 \cdot 1.5 \cdot G
\end{displaymath}
Mit konstantem Zinssatz $p$ und zugeh{\”{o}}rigen Zinsfaktor $1 + p$ ergibt sich am Ende ein Guthaben von
\begin{displaymath}
G_{Ende}=(1+p)^3 \cdot G
\end{displaymath}
Mit $G_{konst} = G_{Ende}$ ergibt sich
\begin{displaymath}
(1+p)^3 \cdot G = 1.2 \cdot 1.7 \cdot 1.5 \cdot G
\end{displaymath}
und damit berechnet sich der durchschnittliche Zinsfaktor $1+p$ zu
\begin{displaymath}
1+p=\sqrt[3]{1.2 \cdot 1.7 \cdot 1.5} \approx 1.04646
\end{displaymath}

Der durchschnittliche Zinssatz betr{\”{a}}gt also ca $4.646 \%$. Allgemein berechnet sich der durchschnittliche Zinsfaktor also aus dem geometrischen Mittel der Zinsfaktoren der einzelnen Jahre. Wegen der Ungleichung vom arithmetischen und geometrischen Mittel ist der durchschnittliche Zinssatz \emph{kleiner} oder bestenfalls gleich dem arithmetischen Mittel der Zinss{\”{a}}tze, welches in diesem Beispiel $\frac{14}{3}\% \approx 4.667 \%$ betr{\”{a}}gt.
\subsection{Spezialfall: Gewichtetes geometrisches Mittel}
Analog zum gewichteten arithmetischen Mittel l{\”{a}}sst sich ein mit den Gewichten $w_{i} > 0$ gewichtetes geometrisches Mittel definieren:
\begin{equation}
\displaystyle
\label{gewgeom}
\bar{x}_{gewgeom}=\sqrt[\omega]{\prod_{i=1}^{n} x_{i}^{\omega_{i}}}=\sqrt[\omega]{x_{1}^{\omega_{1}}\cdot x_{2}^{\omega_{2}}\cdot…\cdot x_{n}^{\omega_{n}}} \qquad \mathrm{wobei}~  \omega=\sum_{i=1}^{n} \omega_{i}=1
\end{equation}
\section{Harmonisches Mittel}
\subsection{Definition}
Das harmonische Mittel ist definiert als
\begin{equation}
\label{harmon}
\bar{x}_{harm}=\frac{n}{\sum_{i=1}^{n}{\frac{1}{x_{i}}}}
\end{equation}
Durch Bildung des Kehrwertes erh{\”{a}}lt man
\begin{displaymath}
\displaystyle
\label{harmon}
\frac{1}{\bar{x}_{harm}}=\frac{\sum_{i=1}^{n}{\frac{1}{x_{i}}}}{n}
\end{displaymath}
der Kehrwert des harmonischen Mittels ist also das arithmetische Mittel der Kehrwerte.
\subsection{Anwendungsbeispiel}
Beispiel f{\”{u}}r das harmonische Mittel von $5$ und $20$:
\begin{displaymath}
\frac{2}{\frac{1}{5}+\frac{1}{20}}=\frac{2}{\frac{1}{4}}=8
\end{displaymath}
Mit dieser Formel ist das harmonische Mittel zun{\”{a}}chst nur f{\”{u}}r von Null verschiedene Zahlen $x_{i}$ definiert. Geht aber einer der Werte $x_{i}$ gegen Null, so existiert der Grenzwert des harmonischen Mittels und ist ebenfalls gleich Null. Daher ist es sinnvoll, das harmonische Mittel als Null zu definieren, wenn mindestens eine der zu mittelnden Gr{\”{o}}ßen gleich Null ist.
\subsection{Spezialfall: Gewichtetes harmonisches Mittel}
Auch hier l{\”{a}}sst sich ein mit den Gewichten $\omega_{i} > 0$ gewichtetes harmonisches Mittel definieren:
\begin{equation}
\label{gewharm}
\bar{x}_{gewharmon}=\frac{\sum_{i=1}^{n}\omega_{i}}{\sum_{i=1}^{n}{\frac{\omega_{i}}{x_{i}}}}
\end{equation}
F{\”{a}}hrt man eine Stunde mit $50$ km/h und dann eine Stunde mit $100$ km/h, so legt man insgesamt $150$ km in $2$ Stunden zur{\”{u}}ck; die Durchschnittsgeschwindigkeit ist $75$ km/h, also das arithmetische Mittel von $50$ und $100$. Bezieht man sich hingegen nicht auf die ben{\”{o}}tigte Zeit, sondern auf die durchfahrene Strecke, so wird die Durchschnittsgeschwindigkeit durch das harmonische Mittel beschrieben: f{\”{a}}hrt man $100$ km mit $50$ km/h und dann $100$ km mit $100$ km/h, so legt man $200$ km in $3$ Stunden zur{\”{u}}ck, die Durchschnittsgeschwindigkeit ist $66$ $2/3$ km/h, also das harmonische Mittel von $50$ und $100$.

Allgemein gilt: Ben{\”{o}}tigt man f{\”{u}}r die Teilstrecke $s_1$ die Zeit $t_1$ (also Durchschnittsgeschwindigkeit $v_1 = s_1 / t_1$) und f{\”{u}}r die Teilstrecke $s_2$ die Zeit $t_2$ (also Durchschnittsgeschwindigkeit $v_2 = s_2 / t_2$, so gilt f{\”{u}}r die Durchschnittsgeschwindigeit {\”{u}}ber die gesamte Strecke
\begin{displaymath}
v=\frac{s_{1}+s_{2}}{t_{1}+t_{2}}=\frac{s_{1}+s_{2}}{\frac{s_{1}}{v_{1}}+\frac{s_{2}}{v_{2}}}=\frac{t_{1}v_{1}+t_{2}v_{2}}{t_{1}+t_{2}}
\end{displaymath}
Die Durchschnittsgeschwindigkeit ist also das mit den Wegstrecken gewichtete harmonische Mittel der Teilgeschwindigkeiten oder das mit der ben{\”{o}}tigten Zeit gewichtete arithmetische Mittel der Teilgeschwindigkeiten.

\chapter{Streuungswerte}

\section{Schwankungsbreite}
\subsection{Definition}
Die Schwankungsbreite ist das Intervall zwischen dem gr{\”{o}}ssten und dem kleinsten Wert der Verteilung. Die Schwankungsbreite ist ein grober Sch{\”{a}}tzwert f{\”{u}}r die Streuung der Verteilung.
\begin{equation}
s=x_{max}-x_{min}
\end{equation}

\section{Standardabweichung}
Die Standardabweichung ist ein Maß, das beschreibt, wie sehr ein Sachverhalt „streut“. Sie wird berechnet, indem man die Abst{\”{a}}nde der Messwerte vom Mittelwert quadriert, addiert und durch die Anzahl der Messwerte teilt.
\subsection{Definition}
\begin{equation}
s=\sqrt{\frac{\sum\limits_{i=1}^N(x_i-\bar{x})^2}{N}}
\end{equation}
\subsection{Anwendungsbeispiel}
Die Bestimmung der Gewichte von $5$ Tabletten ergab in Gramm: $\{0.62; 0.64; 0.68; 0.65\}$\\
Berechne die Standardabweichung der Verteilung:\\

\fbox{\parbox{16cm}{\vspace{1cm}s = \vspace{1cm}}}\\
\subsubsection{TI-92 Voyager}
Die Standardabweichung einer Werteliste \texttt{liste} l{\”{a}}sst sich mit dem Taschenrechner direkt berechnen. Der Befehl lautet: \texttt{stddev(liste)}.\\
\textbf{Aufgabe}
{\”{u}}berpr{\”{u}}fe mit dem Taschenrechner die berechnete Standardabweichung.

\chapter{Stichproben / Sampling}
\section{Definition}
Als Stichprobe bezeichnet man eine Teilmenge einer Grundgesamtheit\footnote{In der empirischen Forschung bezeichnet die Grundgesamtheit (auch Population) die Menge aller potentiellen Untersuchungsobjekte f{\”{u}}r eine bestimmte Fragestellung. Aus pragmatischen Erw{\”{a}}gungen wird normalerweise nicht die Grundgesamtheit, sondern eine Stichprobe untersucht, die f{\”{u}}r die Grundgesamtheit repr{\”{a}}sentativ ist.}, die unter bestimmten Gesichtspunkten ausgew{\”{a}}hlt wurde. Mit Stichproben wird in Anwendungen der Statistik (etwa in der Marktforschung, aber auch in der Qualit{\”{a}}tskontrolle und in der naturwissenschaftlichen, medizinischen und psychologischen Forschung) h{\”{a}}ufig gearbeitet, da es oft nicht m{\”{o}}glich ist, die Grundgesamtheit, etwa die Gesamtbev{\”{o}}lkerung oder alle hergestellten Exemplare eines Produkts, zu untersuchen. Grundgedanke der Zuhilfenahme von Stichproben ist das Induktionsprinzip, bei dem von besonderen auf allgemeine F{\”{a}}lle geschlossen wird.\\

Um die einzelnen Elemente einer Stichprobe zu erhalten, stehen verschiedene Auswahlverfahren zur Verf{\”{u}}gung. Die korrekte Wahl des Auswahlverfahrens ist wichtig, da die Stichprobe repr{\”{a}}sentativ sein muss, um auf die Grundgesamtheit schließen zu k{\”{o}}nnen (siehe dazu z. B. Hochrechnung). Entscheidend ist eine vern{\”{u}}nftige Probenahme, die {\”{u}}ber den Erfolg der Aussage entscheidet. H{\”{a}}ufig sind mehrere Tests notwendig um sicherzustellen, dass tats{\”{a}}chlich rational entschieden wurde.

\section{Stichproben-Typen}

Sollen zwei Stichproben mittels statistischer Tests miteinander verglichen werden, so muss zwischen abh{\”{a}}ngigen und unabh{\”{a}}ngigen Stichproben unterschieden werden:
\begin{description}
\item[Abh{\”{a}}ngige Stichproben:]  Elemente von zwei (oder mehr) Stichproben k{\”{o}}nnen einander jeweils paarweise zugeordnet werden. Beispiel: Stichprobe 1 besteht aus Personen vor der Behandlung mit einem bestimmten Medikament, und soll verglichen werden mit Stichprobe 2, welche aus den gleichen Personen nach der Behandlung besteht.

\item[Unabh{\”{a}}ngige Stichproben: ] Es besteht kein Zusammenhang zwischen den Elementen der Stichproben. Dies ist beispielsweise der Fall, wenn die Elemente der Stichproben jeweils aus unterschiedlichen Population kommen (z. B. Stichprobe 1 besteht aus Frauen, Stichprobe 2 aus M{\”{a}}nnern), oder wenn Personen nach dem Zufallsprinzip in zwei oder mehrere Gruppen aufgeteilt werden.
\end{description}

\section{Auswahlverfahren}
Ein Auswahlverfahren ist die Art und Weise, wie Personen oder Dinge f{\”{u}}r einen Zweck ausgew{\”{a}}hlt werden. Die Statistik besch{\”{a}}ftigt sich in der Kombinatorik mit grunds{\”{a}}tzlich m{\”{o}}glichen Auswahlen. In der Empirie werden mehrere Verfahren (Stichprobenverfahren) zur Auswahl einer repr{\”{a}}sentativen Stichprobe unterschieden. Die unterschiedlichen Wahrscheinlichkeiten eines Elementes der Grundgesamtheit, je nach Auswahlverfahren in die Stichprobe zu gelangen, nennt man Einschlusswahrscheinlichkeit. Als Auswahlverfahren werden auch kommerzielle Verfahren bezeichnet, die an Repr{\”{a}}sentativit{\”{a}}t nicht interessiert sind. Die tats{\”{a}}chliche Auswahl der Auskunftgebenden erfolgt z. B. mit dem Random-Route-Verfahren und dem Schwedenschl{\”{u}}ssel.\\

In der Empirie dient das Auswahlverfahren (auch Stichprobenverfahren) der Ermittlung einer repr{\”{a}}sentativen Stichprobe. Man unterscheidet generell Stufung, Schichtung und Klumpung. Die verschiedenen Typen von Auswahlverfahren k{\”{o}}nnen folgendermaßen charakterisiert werden:\\
\begin{description}
\item[Zufallsauswahlverfahren: ] Bei einem Zufallsauswahlverfahren (auch Wahrscheinlichkeitsauswahl, Zufalls-Stichprobe, Zufallsauswahl, Random-Sample) hat jedes Element der Grundgesamtheit die gleiche Wahrscheinlichkeit (gr{\”{o}}ßer Null), in die Stichprobe zu gelangen. Das erfordert die vorherige Erstellung eines Gesamtverzeichnisses aller Elemente der Grundgesamtheit. Man unterscheidet einstufige und mehrstufige Zufallsauswahlverfahren. Nur bei Zufallsauswahlen sind streng genommen die Methoden der induktiven Statistik anwendbar.
\item[Systematische Stichproben:]  Auswahlverfahren, bei denen subjektive Erw{\”{a}}gungen die Auswahl der Zielpersonen bestimmen. Es werden Vorinformationen {\”{u}}ber die auszuw{\”{a}}hlenden F{\”{a}}lle genutzt. Verallgemeinerungen sind auf der Basis mathematisch-statistischer Modelle bei bewussten Auswahlen nicht m{\”{o}}glich.

\item[Willk{\”{u}}rliche Stichproben: ]Elemente aus der Grundgesamtheit werden (etwa von einem Interviewer) mehr oder weniger willk{\”{u}}rlich in die Stichprobe aufgenommen, es liegt ausschließlich im Ermessen des Interviewers oder auch der Untersuchungspersonen selbst.
\end{description}

\chapter{Erstellen einer eigenen Statistik}

Versuchen Sie, so gut wie Ihnen m{\”{o}}glich, die folgenden f{\”{u}}nf Kriterien zu erf{\”{u}}llen: „Objektivit{\”{a}}t“ (Unabh{\”{a}}ngigkeit vom Standpunkt des Statistikerstellers), „Reliabilit{\”{a}}t“ (Verl{\”{a}}sslichkeit), „Validit{\”{a}}t“ ({\”{u}}berkontextuelle G{\”{u}}ltigkeit), „Signifikanz“ (Bedeutsamkeit) und „Relevanz“ (Wichtigkeit).\\

\section{Aufgabe 1: Erstellen einer K{\”{o}}rpergr{\”{o}}ssen-Handfl{\”{a}}chen Statistik}

Messen Sie alle K{\”{o}}rpergr{\”{o}}ssen und Handfl{\”{a}}chen in der Klasse aus.Wir m{\”{o}}chten es ganz genau wissen. Pr{\”{a}}sentieren Sie Ihre Resultate grafisch sowie m{\”{u}}ndlich. Gibt es eine Korrelation zwischen den beiden erhobenen Datens{\”{a}}tzen? Zusatz: Wie verhalten sich die Daten in Abh{\”{a}}ngigkeit mit dem Alter der Personen?

\section{Aufgabe 2: Erstellen einer Raucher und Drogen Statistik}

Erheben Sie Daten. Ziehen Sie alle m{\”{o}}glichen M{\”{o}}glichkeiten in Betracht, denn wir wollen es ganz genau wissen. Wieviel wird an der Kantonsschule Luzern geraucht? Vieviele Drogen werden an der Kantonsschule Luzern konsumiert? Pr{\”{a}}sentieren Sie Ihre Resultate m{\”{u}}ndlich und grafisch und verweisen Sie auf alle Schwierigkeiten, die Sie bew{\”{a}}ltigen mussten.

\chapter{Korrelation, lineare Regression, R-Software}

\section{Korrelation}
\subsection{Definition}
Die Korrelation ist eine Beziehung zwischen zwei oder mehr statistischen Variablen. Wenn sie besteht, ist noch nicht gesagt, ob eine Gr{\”{o}}ße die andere kausal beeinflusst, ob beide von einer dritten Gr{\”{o}}ße kausal abh{\”{a}}ngen oder ob sich {\”{u}}berhaupt ein Kausalzusammenhang folgern l{\”{a}}sst.
\subsection{Genauere Beschreibung}
Es gibt positive und negative Korrelationen. Ein Beispiel f{\”{u}}r eine positive Korrelation (je mehr, desto mehr) ist: Je mehr Futter, desto dickere K{\”{u}}he. Ein Beispiel f{\”{u}}r eine negative Korrelation (je mehr, desto weniger) ist: „Je mehr zur{\”{u}}ckgelegte Strecke mit dem Auto, desto weniger Treibstoff ist vorhanden.“
H{\”{a}}ufig benutzt man zu Recht die Korrelation, um einen Hinweis darauf zu bekommen, ob zwei statistische Gr{\”{o}}ßen urs{\”{a}}chlich miteinander zusammenh{\”{a}}ngen. Das funktioniert immer dann besonders gut, wenn beide Gr{\”{o}}ßen durch eine „Je…desto“ Beziehung miteinander zusammenh{\”{a}}ngen und eine der Gr{\”{o}}ßen nur von der anderen Gr{\”{o}}ße abh{\”{a}}ngt.\\
Beispielsweise kann man unter bestimmten Bedingungen nachweisen, dass Getreide umso besser gedeiht, je mehr man es bew{\”{a}}ssert. H{\”{a}}ngt die Menge oder Qualit{\”{a}}t des Getreides jedoch zus{\”{a}}tzlich zum Wasser noch von anderen Variablen ab (beispielsweise von der Temperatur, dem N{\”{a}}hrstoffgehalt des Bodens, dem einfallenden Licht usw.), „verw{\”{a}}scht“ der kausale Zusammenhang in der Statistik immer mehr, falls nicht gleichzeitig diese Variablen auch untersucht werden.
Die Korrelation beschreibt aber nicht unbedingt eine Ursache-Wirkungs-Beziehung in die eine oder andere Richtung. So darf man {\”{u}}ber die Tatsache, dass man Feuerwehren oft bei Br{\”{a}}nden findet, nicht folgern, dass Feuerwehren die Ursachen f{\”{u}}r Br{\”{a}}nde seien.\\
Die direkte Kausalit{\”{a}}t kann auch g{\”{a}}nzlich fehlen. So kann es durchaus eine Korrelation zwischen dem R{\”{u}}ckgang der St{\”{o}}rche im Burgenland und einem R{\”{u}}ckgang der Anzahl Neugeborener geben, diese Ereignisse haben aber nichts miteinander zu tun – weder bringen St{\”{o}}rche Kinder noch umgekehrt. Das heißt, sie haben kausal allenfalls {\”{u}}ber eine dritte Gr{\”{o}}ße etwas miteinander zu tun, etwa {\”{u}}ber die Verst{\”{a}}dterung, die sowohl Nistpl{\”{a}}tze vernichtet als auch Kleinstfamilien f{\”{o}}rdert.
Im Gegensatz zur Proportionalit{\”{a}}t ist die Korrelation nur ein statistischer Zusammenhang. Es kann nur eine ungef{\”{a}}hre Zu- oder Abnahme prognostiziert werden. Eine 200-prozentige Steigerung der Futtermenge kann eine Gewichtszunahme der K{\”{u}}he von 10 \% oder auch von 20 \% bewirken.
\section{Lineare Regression: Methode der kleinsten Quadrate}
Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Es ist eine Wolke aus Datenpunkten gegeben, die physikalische Messwerte, wirtschaftliche Gr{\”{o}}ßen oder {\”{a}}hnliches repr{\”{a}}sentieren k{\”{o}}nnen. In diese Punktwolke soll eine m{\”{o}}glichst genau passende, parameterabh{\”{a}}ngige Modellkurve (z.B. eine Gerade) gelegt werden. Dazu bestimmt man die Parameter (im Falle der Gerade: Steigung $a$  und der $y$-Achsenabstand $b$)  dieser Kurve numerisch, indem \emph{die Summe der quadratischen Abweichungen der Kurve von den beobachteten Punkten minimiert wird}.\\

\subsection{Gerade durch drei Punkte?}
\begin{figure}[brh!]
\begin{center}
\includegraphics[width=10cm]{GeradeDurch3Pkte.pdf}
\caption{Gerade durch drei Punkte?}
\label{g3p}
\end{center}
\end{figure}

Der Ansatz $y = ax + b$ f{\”{u}}r die Geradengleichung enth{\”{a}}lt zwei freie Parameter $a$ und $b$, die zu bestimmen sind. W{\”{a}}re die Einsetzprobe f{\”{u}}r die Koordinaten der drei Punkte $P_1$ , $P_2$ und $P_3$ erf{\”{u}}llt, so w{\”{u}}rden die folgenden Beziehungen gelten:

\begin{displaymath}
\begin{array}{ccc}
0  &=&-3a+b    \\
0 &=& a+b  \\
0&=& 2a+b
\end{array}
\end{displaymath}
oder mit den Abk{\”{u}}rzungen
\begin{displaymath}
\vec{1} =
\left( \begin{array}{c}
1 \\
1 \\
1
\end{array} \right),
\qquad
\vec{x} =
\left( \begin{array}{c}
-3 \\
1 \\
2
\end{array} \right),
\qquad
\vec{y} =
\left( \begin{array}{c}
0 \\
0 \\
1
\end{array} \right),
\end{displaymath}

die Vektorgleichung $\vec{y} = a\vec{x} + b\vec{1}$. Widerspr{\”{u}}che verhindern die L{\”{o}}sbarkeit dieser Gleichungen. Aber die Ordinatenwerte $y_i$ der drei Punkte $P_i$ d{\”{u}}rfen ver{\”{a}}ndert werden, um eine L{\”{o}}sung zu erzwingen. Es ist, genauer gesagt, ein
Vektor $\vec{y}$ gesucht, der in der Ebene $\epsilon$ aller Linearkombinationen von $\vec{1}$ und $\vec{x}$ liegt und f{\”{u}}r welchen die L{\”{a}}nge des Differenzvektors $\vec{r} = \vec{y}-\vec{y}~’$ minimal wird da $\| \vec{r} \| \geqslant 0$ gilt, befindet sich das Minimum von $\| \vec{r} \| $ an derselben Stelle wie jenes von
\begin{displaymath}
\| \vec{r} \| ^2 = \| \vec{r} \| \cdot \| \vec{r} \| = \sum_{i=1}^{3} r_{i}^2 ,
\end{displaymath}
wobei angenommen wurde, dass $r_i$ kartesische Koordinaten von $\vec{r}$ bezeichnen. Also ist die \emph{Normalprojektion} $\vec{y}~’$ von $\vec{y}$ auf $\epsilon$ der \emph{beste Kompromiss im Sinne der Methode der kleinsten Quadrate}.\\

\subsection{Die L{\”{o}}sung des Minimierungsproblems im Sinne der Methode der kleinsten Quadrate}
In unserem Falle ist der lineare Ansatz $y_i = a + bx_i$. Indem man die $x_i$ zur Datenmatrix $A$, die Parameter $a$ und $b$ zum Parametervektor $\vec{p}= (a,b)^T$ und die Beobachtungen $y_i$ zum Vektor $\vec{y}$ zusammenfasst, kann man das lineare Gleichungssystem in Matrixform darstellen und der kleinste-Quadrate-Ansatz f{\”{u}}hrt dann wieder wie oben auf ein lineares Ausgleichsproblem der Form
\begin{displaymath}
\min_{a,b}
\Bigg\|
\left( \begin{array}{c}
y_1\\
y_2\\
y_3
\end{array} \right)

\left( \begin{array}{cc}
1&x_1\\
1&x_2\\
1&x_3
\end{array} \right)
\left( \begin{array}{c}
a\\
b
\end{array} \right)
\Bigg\|_2
=\min_{\vec{p}}\| \vec{y}-A\vec{p}\|_2.
\end{displaymath}
F{\”{u}}r die resultierende Ausgleichsgerade dieses einfachen (aber durchaus relevanten) Beispiels lassen sich die L{\”{o}}sungen f{\”{u}}r die Parameter direkt angeben als
\begin{displaymath}
b=\frac{(\sum_{i=1}^{3} x_i y_i)-3 \bar{x}\bar{y}}{(\sum_{i=1}^{3}   x_{i}^{2} )-3 (\bar{x})^2} \qquad \mathrm{und} \qquad a= \bar{y}-b \bar{x}
\end{displaymath}
mit $\bar{x}=\frac{1}{3}\sum_{i=1}^{3}x_i$ als arithmetisches Mittel der $\vec{x}$-Werte ($\bar{y}$ entsprechend).\\
\\
Die L{\”{o}}sung f{\”{u}}r $b$ kann mit Hilfe des Verschiebungssatzes auch als
\begin{displaymath}
b=\frac{\sum_{i=1}^{3}(x_i-\bar{x})(y_i-\bar{y})}{\sum_{i=1}^{3} (x_i-\bar{x})^2}
\end{displaymath}
angegeben werden.\\

Unser Minimierungsproblem hat immer eine eindeutige L{\”{o}}sung wenn die Matrix $A$ vollen Rang hat. Die partiellen Ableitungen bez{\”{u}}glich der $p_i$ und Nullsetzen derselben zum Bestimmen des Minimums ergeben ein lineares System von Normalgleichungen (auch Normalengleichungen) ergeben die sch{\”{o}}nste und k{\”{u}}rzeste Form:
\begin{displaymath}
A^T A\vec{p}=A^T \vec{y} \qquad \mathrm{resp.} \qquad \vec{p}=(A^T A)^{-1}A^T \vec{y}.
\end{displaymath}

\section{R-Software}
Das R-Package ist eine Software f{\”{u}}r: Datenkompilation, Statistische Datenanalyse und graphische Darstellung von Datens{\”{a}}tzen und analytischen Resultaten. Alle standard Routinen sind implementiert (z.B. auch die lineare Regression im Sinne der Methode der kleinsten Quadrate).

\subsection{Deskriptive Statistik:}
\begin{itemize}
\item summary statistics: \texttt{summary}
\item sample range: \texttt{range}
\item sample mean: \texttt{mean}
\item sample standard deviation: \texttt{sd}
\item sample variance: \texttt{var}
\item sample correlation matrix: \texttt{cor}
\item sample quantiles: \texttt{quantile}
\end{itemize}
Examples:\\
\texttt{ y <- c(3,5,2,6,4,2,7,4,3,3,4)}\\
\texttt{summary(y); range(y); mean(y); sd(y); var(y);\\
quantile(y,seq(0,1,by=0.05))}

\subsection{Regression}
\begin{itemize}
\item linear regression: \texttt{lm}
\item nonlinear regression: \texttt{nls}
\item generic functions on results: \texttt{summary, residuals, predict, coefficients}
\end{itemize}
Examples:\\
\texttt{x <- c(0,1,2,3,4,5,6,7,8,9,10)\\
y <- c(3,5,2,6,4,2,7,4,3,3,4)\\
res.lm <- lm(y $\sim$ x); summary(res.lm)\\
residuals(res.lm)\\
predict(res.lm,interval=”confidence”)\\
coefficients(res.lm)\\
summary(res.lm)\$coefficients}

\subsection{Univariate Wahrscheinlichkeitsverteilungen:}
\begin{itemize}
\item normal: \texttt{norm}
\item log-normal: \texttt{lnorm}
\item beta: \texttt{beta}
\item gamma: \texttt{gamma}
\item Student’s t: \texttt{t }
\item uniform: \texttt{unif}
\item etc.
\end{itemize}
Example:\\
\texttt{x <- rnorm(1000,0,1); hist(x,freq=F) \\
lines(seq(-3,3,by=0.1),dnorm(seq(-3,3,by=0.1),0,1))}

\subsection{Aufgabe in R:}

Versuchen Sie die korrelierenden Daten der K{\”{o}}rpergr{\”{o}}sse-Handfl{\”{a}}chen Statistik zu auf ein lineares Modell zu fitten. Benutzen Sie dazu den vorbereiteten Skript:

\begin{verbatim}
#Eingabe
x <- c(-3,1,2)
y <- c(0,0,1)
#Verarbeitung
res.lm <- lm(y~x)
summary(res.lm)
#y=a+bx
a<-coef(res.lm)[1]
b<-coef(res.lm)[2]
gerade<- function (x) a+b*x
#Ausgabe
plot(x, y ,col=1 ,xlab =”x”,ylab =”y”)
x<-seq(min(x), max(x),length=100000)
curve(gerade(x), min(x), max(x), col=1, add = TRUE)
\end{verbatim}

\chapter{Wenn  bei der Datenerhebung nur gesch{\”{a}}tzt werden kann}
Dieses Kaptitel verl{\”{a}}sst die Materie der deskriptiven Statistik. Ziel ist, unpr{\”{a}}zises Wissen in Form von Wahrscheinlichkeiten zu erheben. Voraussetzungen f{\”{u}}r die Abhandlung sind Grundkenntnisse {\”{u}}ber kumulative Wahrscheinlichkeitsverteilungen $F(\theta)=P(\Theta<\theta)$ (CDFs cumulative distribution functions) und Wahrscheinlichkeitsdichten $f(\theta)$ mit $\int_{\theta_1}^{\theta_2} f(\theta)~d\theta= P(\theta_1<\Theta<\theta_2)$ (PDFs probability density funtions).\\

\begin{figure}
\begin{center}
\includegraphics[width=10cm]{Dichtefunktion.pdf}
\caption{Dichtefunktion der Normalverteilung $N(\mu=0,\sigma=1)$}
\label{N}
\end{center}
\end{figure}

\begin{figure}
\begin{center}
\includegraphics[width=10cm]{CDF.pdf}
\caption{kumulative Wahrscheinlichkeitsverteilungen der Normalverteilung $N(\mu=0,\sigma=1)$}
\label{N}
\end{center}
\end{figure}

\section{Erhebung von Quantilen}

Indem man in der Gleichung der kumulativen Wahrscheinlichkeitsverteilung $F(\theta)=P(\Theta<\theta)$ den Wert $P$ fixiert und den Experten nach einem gesch{\”{a}}tzten Parameterwert $\theta$ fragt, erhebt man sogenannte Quantile.\\

Der meist gefragte Parameterwert ist der Median, das ist wenn $P=50\%$ betr{\”{a}}gt. Weitere beliebte Quantile sind die Quartile, das ist wenn  $P=25\%$ bez. $P=75\%$  betr{\”{a}}gt.\\
\\
Anbei die dazugeh{\”{o}}rigen Fragen:
\begin{description}
\item[Median] K{\”{o}}nnen Sie einen Wert $\theta_m$ bestimmen so dass $\Theta$ dieselbe Chance hat kleiner bzw. gr{\”{o}}sser als diesen Wert zu sein?
\item[unteres Quartil] Nehmen wir an $\Theta$ ist kleiner als der Median. K{\”{o}}nnen Sie einen neuen Wert $\theta_lq$ angeben, f{\”{u}}r den die Chance f{\”{u}}r $\Theta$  gleich gross ist kleiner bzw. gr{\”{o}}sser als diesen Wert zu sein?
\item[oberes Quartil] Nehmen wir an $\Theta$ ist gr{\”{o}}sser als der Median. K{\”{o}}nnen Sie einen neuen Wert $\theta_lq$ angeben, f{\”{u}}r den die Chance f{\”{u}}r $\Theta$ gleich gross ist kleiner bzw. gr{\”{o}}sser als diesen Wert zu sein?
\end{description}

\section{Heuristiken}

Heuristik (altgr. heurísko „ich finde“; heuriskein, „(auf-)finden“, „entdecken“) bezeichnet die Kunst, wahre Aussagen zu finden, im Unterschied zur Logik, die lehrt, wahre Aussagen zu begr{\”{u}}nden. Gerd Gigerenzer definiert wie folgt: Als Heuristik bezeichnet man eine Methode, komplexe Probleme, die sich nicht vollst{\”{a}}ndig l{\”{o}}sen lassen, mit Hilfe einfacher Regeln und unter Zuhilfenahme nur weniger Informationen zu entwirren.

\subsection{Die Ankerheuristik}
Mit Anker- und Anpassungsheuristik bezeichnet man in der Sozialpsychologie eine unbewusste mentale Abk{\”{u}}rzung, bei der sich das Urteil an einem beliebigen (willk{\”{u}}rlichen) Anker orientiert. Die Folge ist eine systematische Verzerrung in Richtung des Ankers.
Beispiel von Daniel Kahneman: Wenn ein Publikum zuerst gebeten wird, die letzten vier Ziffern der eigenen Sozialversicherungsnummer auswendigzulernen, und dann die Anzahl der {\”{a}}rzte in New York sch{\”{a}}tzen soll, dann betr{\”{a}}gt die Korrelation beider Zahlen etwa 0.4 – weit mehr als dem Zufall entsprechen w{\”{u}}rde! An die erste Zahl nur zu denken, beeinflusst die zweite, obwohl es keine logische Verbindung zwischen beiden gibt.\\

Nicht nur Zahlen k{\”{o}}nnen als Anker dienen, sondern auch pers{\”{o}}nliche Erfahrungen und Beobachtungen.

\subsection{Die Verf{\”{u}}gbarkeitsheuristik}
Die Verf{\”{u}}gbarkeitsheuristik (engl. Availability heuristic) geh{\”{o}}rt in der Sozialpsychologie zu den sog. Urteilsheuristiken, welche gewissermaßen Faustregeln darstellen, um Sachverhalte auch dann beurteilen zu k{\”{o}}nnen, wenn kein Zugang zu pr{\”{a}}zisen Informationen besteht. Die Bezeichnung Verf{\”{u}}gbarkeitsfehler (engl. Availability error) ist ebenfalls gebr{\”{a}}uchlich f{\”{u}}r die dem Spielerfehlschluss verwandte Wahrnehmungsverzerrung. Sie beruht auf der Tendenz, bestimmte Ereignisse h{\”{o}}her zu gewichten und eher in Erinnerung zu rufen als andere Ereignisse.

\subsection{Die Repr{\”{a}}sentativit{\”{a}}tsheuristik}
Die Repr{\”{a}}sentativit{\”{a}}tsheuristik geh{\”{o}}rt in der Sozialpsychologie zu den Urteilsheuristiken, welche gewissermaßen Faustregeln darstellen, um trotz großer Unsicherheit in Situationen zu schnellen und {\”{o}}konomischen Urteilen zu kommen.
Je {\”{a}}hnlicher eine Person einem typischen Vertreter einer bestimmten Gruppe ist, desto eher ordnet man die Person dieser Gruppe zu.
In einer klassischen Untersuchung boten Daniel Kahneman und Amos Tversky (1983) ihren Versuchspersonen die schriftliche Beschreibung einer weiblichen Person namens Linda dar. Darin wurde sehr viel {\”{u}}ber Lindas T{\”{a}}tigkeit f{\”{u}}r Frauenrechte und Emanzipation berichtet. Danach wurden die Probanden gefragt, was denn nach dieser Beschreibung wahrscheinlicher sei, dass Linda “eine Bankangestellte” oder “eine Bankangestellte und Feministin” sei. Die Mehrzahl der Versuchspersonen sch{\”{a}}tzte die Wahrscheinlichkeit, dass Linda “Bankangestellte und Feministin” sei, wesentlich h{\”{o}}her ein.
Diese Einsch{\”{a}}tzung ist jedoch irrig, denn die Wahrscheinlichkeit f{\”{u}}r das gleichzeitige Auftreten beider Ereignisse kann nicht gr{\”{o}}ßer sein, als die Wahrscheinlichkeit, dass eines der beiden Ereignisse alleine eintritt (Konjunktion, und-Verkn{\”{u}}pfung). (Selbst wenn alle Bankangestellten auch Feministinnen sind, w{\”{a}}ren die beiden Wahrscheinlichkeiten f{\”{u}}r (1) “Bankangestellte” und f{\”{u}}r (2) “Bankangestellte und Feministin” gleich groß.)

\section{Aufgabe: Einsch{\”{a}}tzung der Anzahl Raucher pro Klasse an der Schule}

\begin{figure}[rh]
\begin{center}
\includegraphics[width=15cm]{Rplot.pdf}
\caption{Gefittete Lognormalverteilung des Datensatzes: $x=(0,3,4,5,20)$, $y=(0,0.25,0.5,0.75,0.9999$. Der Plot entspricht dem untenstehenden R-Programm.}
\label{rPlot}
\end{center}
\end{figure}

Sch{\”{a}}tzen Sie die Anzahl Raucher pro Klasse an der Schule. Erfragen Sie den Median, das untere und obere Quartil. Tun Sie das in Abh{\”{a}}ngigkeit des Jahrganges. Nehmen sie als Standardklassengr{\”{o}}sse 20 Sch{\”{u}}ler. Vergleichen Sie die Ergebnisse mit der Raucherstatistik aus dem obigen Kapitel. Versuchen Sie die Unterschiede zu erkl{\”{a}}ren.\\

Geben Sie die Daten in folgendes R-Programm ein, welches die Daten mit einer Lognormalverteilung fittet:
\begin{verbatim}

rm(list=ls())

#INPUT

#Quantiles
q <- c(0, 3, 4, 5, 20)
#Probabilities
p <- c(0, 0.25, 0.5, 0.75, 0.9999)

#PROCESSING

# LOG NORMAL Distribution Fit of Quantilefunction
qlnorm.nls <- nls(q ~ qlnorm(p, meanlog = A, sd = B),
start=list(A = 2, B = 1))

#Define Functions dnorm qnorm pnorm
fln<- function (x) dlnorm( x, meanlog=coef(qlnorm.nls)[1],
sdlog=coef(qlnorm.nls)[2])
Fln<- function (x) plnorm( x, meanlog=coef(qlnorm.nls)[1],
sdlog=coef(qlnorm.nls)[2])
qln<- function (x) qlnorm( x, meanlog=coef(qlnorm.nls)[1],
sdlog=coef(qlnorm.nls)[2])

#Calculation of Factor Kappa
x<-seq( q[1], q[5],length=100000)

# def FLower envelope
Fl<- function (x, k) (Fln(x)/(Fln(x)+k*(1-Fln(x))))
# def FUpper envelope
Fu<- function (x, k) (k*Fln(x)/(k*Fln(x)+(1-Fln(x))))

k<-1
k1.temp<-rep(1,length(q))
k2.temp<-rep(1,length(q))
#calculation of k
for(i in 1:length(q)){
if(p[i]<Fln(q[i])) {k1.temp[i]
<-(Fln(q[i])*(1-p[i]))/(p[i]*(1-Fln(q[i])))}
if (p[i]>Fln(q[i])){k2.temp[i]
<-(p[i]*(1-Fln(q[i])))/(Fln(q[i])*(1-p[i]))}
k<-max(k1.temp,k2.temp)}

#OUTPUT

par(mfrow=c(1,3))

#plot 1

#plot elicitated data
plot(q, p ,col=1 , xlab =(expression(theta)), ylab =”CDF”)

#plot CDF of fitted Log-Normal-Distribution
curve(Fln(x), q[1]*1.2,q[5]*1.2, col=1, add = TRUE,lty=”dotted”)

#plot 2

#empty plot to set the second frame
plot(numeric(0),numeric(0),xlim=c(q[1]*1.2,q[5]*1.2)
ylim=c(0,k*max(fln(x))*1.1), xlab = (expression(theta)),
ylab =”Density Ratio PDFs”)

#plot PDF of fitted Log-Normal Distribution
curve(fln(x), q[1]*4, q[5]*4, col=1, add = TRUE,lwd=”2″ )

#plot the unnormalized PDF of the fitted Log-Normal Distribution
curve(k*fln(x), q[1]*4, q[5]*4, col=1, add = TRUE,lwd=”2″)

#empty plot to set the fird frame
plot(numeric(0),numeric(0),xlim=c(q[1]*1.2,q[5]*1.2),ylim=c(0,1),
xlab = (expression(theta)), ylab =”Probability”)

curve(Fl(x,k), q[1]*4, q[5]*4, col=1, add = TRUE,lwd=”2″)
curve(Fu(x,k), q[1]*4, q[5]*4, col=1, add = TRUE,lwd=”2″)
points(q, p ,col=1 , xlab =(expression(theta)), ylab =””)

#prints
#print fitting coefs of normal distribution
summary(qlnorm.nls)
#print final factor used
k
\end{verbatim}

% D. Literaturverzeichnis https://blogs.ethz.ch/rindi/
% ***********************************************
%\begin{thebibliography}{99}
%\end{thebibliography}

\end{document}

Anbei die nötigen Figures:

geradedurch3pkte.pdf

rplot.pdf

cdf.pdf

dichtefunktion.pdf

folio.pdf

Übungsvorlage | Fehlerrechnung

Übungsvorlage in pdf: Übungen_Fehlerkalkul.pdf

Anbei die Version in LaTeX:

% A. PR{\”{a}}AMBEL https://blogs.ethz.ch/rindi/
% ***********************************************

\documentclass[smallheadings,headsepline,12pt,a4paper]{scrartcl}
\usepackage[ngerman, french]{babel}
\usepackage[applemac]{inputenc} % teilt LaTeX die Texcodierung mit. Bei Windowssystemen: ansinew
\usepackage[T1]{fontenc}
\usepackage{hyperref}
\usepackage[pdftex]{graphicx}
\usepackage{multicol}
\usepackage{color}
\usepackage[dvips]{geometry}
\pagestyle{plain}
\clubpenalty = 10000
\widowpenalty = 10000
\selectlanguage{ngerman}

\begin{document}

% B. TITEL https://blogs.ethz.ch/rindi/
% *************************************

\titlehead{
\hfill Alpen der \today}
\subject{
\sc{{\”{u}}bungen}}
\title{\sc{Kalk{\”{u}}l mit der Ungenauigkeit}}
\author{\sc{- 4K -}}
\date{Kantonsschule Grindelwald}
\maketitle

% C. UEBUNGEN https://blogs.ethz.ch/rindi/
% *******************************************

\begin{tabbing}
a) \= \quad \=
\kill

\textbf{Aufgabe 1:}\\
\\
Von einem Zylinder wurde der Durchmesser $D=4.84\pm0.01$
cm, die H{\”{o}}he $h=6.74\pm0.01$ cm\\
und durch W{\”{a}}gung die Masse $m=968.5\pm0.1$ g bestimmt.\\
\\
\>a) \>Wie gross ist die Schranke f{\”{u}}r den absoluten\\ \>  \>und relativen Fehler f{\”{u}}r die Dichte $\rho$ des Zylinders?\\
\\
\>b) \>Welchen Fehler kann man vernachl{\”{a}}ssigen?\\
\\
\>c) \>Wie gross ist der maximale Fehler f{\”{u}}r $\rho$?\\
\\
\end{tabbing}

\textbf{Aufgabe 2:}\\
\\
Ein Hohlzylinder hat den {\”{a}}usseren Radius $r_{1}\approx10$ cm, den inneren Radius $r_{2}\approx8$ cm und die H{\”{o}}he $h\approx12$ cm. Mit welchen absoluten Fehlern d{\”{u}}rfen diese drei Gr{\”{o}}ssen gemessen werden, damit der relative Maximalfehler des Volumens h{\”{o}}chstens $\pm2\%$ betr{\”{a}}gt?\\

Allgemeine Annahme: Die Fehler in den Messungen sollen je zu einem $\frac{1}{n}$-Teil  zum gesammten absoluten Fehler beitragen (Beispiel: Drei Messungen $\Rightarrow$ jede Messung tr{\”{a}}gt $\frac{1}{3}$ zum Gesamtfehler bei).\\
\newpage

\textbf{Aufgabe 3:}\\
\\
Zur Bestimmung der nicht messbaren Strecke $\bar{AB}$ wurde ein Hilfspunkt $C$ gew{\”{a}}hlt, und dann wurden die Strecken $\bar{AC}$, $\bar{BC}$ und der Winkel $\gamma$ gemessen. Wie gross ist die Strecke $\bar{AB}$ und der absolute Maximalfehler wenn gilt:\\
\\
$\bar{AC}=402.35\pm0.05$ m\\
$\bar{BC}=364.76\pm0.05$ m\\
$cos \gamma = 0.37327\pm0.00008$ (Radmass)\\
\\

\textbf{Aufgabe 4:}\\
\\
Man berechne die Wertschranke des formalen Ausdrucks $A_{i}$:\\
\\
\begin{displaymath}
A_{1}=\frac{2a^2bc}{(b+c)^2}
\end{displaymath}

\begin{displaymath}
A_{2}=\frac{a^2c-b^2c}{2a^2-ab-3b^2}
\end{displaymath}

\begin{displaymath}
A_{3}=\frac{a(1-b)^3}{2c}\\
\end{displaymath}
\\
f{\”{u}}r $a=3.02\pm0.0800 \qquad b=1.03\pm0.0400 \qquad c= -0.0300\pm 0.0040$\\
\\
Dabei sind die Formeln $A_{i}$ exakt!\\

\textbf{Aufgabe 5:}\\
\\
Die Zahl $\pi$ werde durch die N{\”{a}}herungswerte $z_{1}=\frac{22}{7}$ und $z_{2}=\frac{355}{113}$ ersetzt.\\
\\

\begin{tabbing}
a) \= \quad \=
\kill
\>a) Wie gross sind die wahren Fehler von $z_{1}$ und $z_{2}$ (auf 2 signifikante Stellen genau)? \\
\>b) Welchen Fehler erh{\”{a}}lt man f{\”{u}}r die Fl{\”{a}}che eines Kreises mit dem Radius $r=5$ cm,\\
\> \>wenn man mit $z_{1}$ bzw. $z_{2}$ rechnet?
\end{tabbing}

\newpage
\textbf{Aufgabe 6:}\\
\\
Berechnen Sie die absoluten und relativen Fehlerschranken der Anziehungskraft $F$ zwischen Sonne und Erde, wenn gilt:\\
\\
\begin{displaymath}
F=\Gamma\frac{M_{s}M_{e}}{r^2}
\end{displaymath}
\\
$M_{e}=5.976 \ 10^3kg \quad  M_{s}=333.1 \ 10^3 \ M_{e}  \quad r=149.6 \ 10^6 \ km \quad \Gamma=6.670 \ 10^{-11} \ m^3 \ kg^{-1} \ s^{-2}$
\\

\textbf{Aufgabe 7:}\\
\\
Aus der L{\”{a}}nge $l=118.5$ cm und der Schwingungsdauer $T=2.180$ s eines mathematischen Pendels soll die Erdbeschleunigung $g$ berechnet werden. Wie genau m{\”{u}}ssen $l$ und $T$ bestimmt werden, damit der absolute Maximalfehler von $g$ nicht mehr als $\pm1cm$ $s^{-2}$ betr{\”{a}}gt?\\

Es gilt f{\”{u}}r kleine Auslenkungen:\\
\\

\begin{displaymath}
T=2\pi \sqrt{ \frac{l}{g}}
\end{displaymath}

\textbf{Aufgabe 8:}\\
\\
a) Berechnen Sie die Fehlerschranken f{\”{u}}r den absoluten und relativen Fehler von $Q_{i}$.\\
b) Berechnen Sie die Wertschranken f{\”{u}}r $Q_{i}$ und das Resultat.

\begin{displaymath}
Q_{1}=\frac{2a^2-b^2}{5c \ 3ab}
\end{displaymath}

\begin{displaymath}
Q_{2}=3a^5 \ 2b^2 \ + \ \frac{3ab}{22b^2}
\end{displaymath}
\\
Wobei:\\
\\
$a= -2.2\pm0.2$\\
$b=3.1\pm0.3$\\
$c=4.3\pm0.4$\\
\\

\end{document}

Prüfungsvorlage Bogen B | ggT (grösster gemeinsamer Teiler) | kgV (kleinstes gemeinsame Vielfache) |

Eine Prüfungsvorlage in pdf: Prüfung-ggT-Kgv-Bogen-b.pdf

Die Lösung in pdf: Lösung-ggT-kgV-Bogen-b.pdf

Anbei die Version der Prüfung in LaTeX:

% A. PRAEAMBEL https://blogs.ethz.ch/rindi
% ******************************************************************
\documentclass[smallheadings,headsepline,12pt,a4paper]{scrartcl}
\usepackage[ngerman, french]{babel}
\usepackage[applemac]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{hyperref}
\usepackage[pdftex]{graphicx}
\pagestyle{plain}
\clubpenalty = 10000
\widowpenalty = 10000
\selectlanguage{ngerman}
\begin{document}
% B. PRUEFUNG/TEST https://blogs.ethz.ch/rindi
% *************************************************
\titlehead{
\hfill Niedwalden der \today}
\subject{
\sc{Pr\”ufungsbogen B}}
\title{\sc{- ggT – kgV -}}
\author{\sc{Klasse 1}}
\date{Kantonsschule Niedwalden}
\maketitle
% B. DOKUMENT        https://blogs.ethz.ch/rindi
% *************************************************
\begin{center}
\begin{tabular}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}
\hline
Aufgabe &1&2&3&4&5&6&7&8&9&10&11&12&13 &Total\\
\hline
Punkte  &1&1&1&1&2&2&2&2&2&1&2&4&4 &25 \\
\hline
\end{tabular}
\end{center}
Du hast 90 Minuten Zeit. Achte auf eine saubere Darstellung. Der L\”osungsweg muss klar
ersichtlich sein, dazu geh\”ort: die gesuchte Variable ist klar gekennzeichnet, die Rechnung
ist vorhanden und sauber gel\”ost und am Schluss steht ein Antwortsatz. Viel Erfolg!

\begin{enumerate}
\item Was sind “Nat\”urliche Zahlen”?
\item Was ist eine “Primzahl”?
\item Defniniere mathematisch “Vielfaches einer Nat\”urlichen Zahl”.
\item Defniniere mathematisch “Teiler einer Nat\”urlichen Zahl”.
\item Definiere mathematisch das “kgV” \emph{und} mache ein einfaches Beispiel dazu.
\item Definiere mathematisch den “ggT” \emph{und} mache ein einfaches Beispiel dazu.
\item Errechne: (a) $kgV(324,72)$ $\quad$ (b) $kgV(51,36,102)$
\item Errechne: (a) $ggT(324,72)$ $\quad$ (b) $ggT(432,288,672)$
\item Zwei Telefonkabel sind $174$ m und $232$ m lang. Sie sind so zu zerschneiden,
dass daraus m\”oglichst grosse, gleich lange Telefonkabelst\”ucke zum Weiterverkauf
entstehen und kein Restst\”uck bleibt. Wie lang wird ein solches Telefonkabelst\”uck?

\item Zwei \emph{gleichnennrige} Br\”uche k\”onnen bekanntlich sehr einfach addiert werden.
Berechne $x=\frac{11}{324}+\frac{5}{72}$, indem Du die Br\”uche mit Hilfe des kgVs gleichnennrig machst.

\item Ein(e) Innenarchitekt(in) will eine  92 cm lange und  68 cm breite Tischplatte mit m\”oglichst grossen, quadratischen Mosaikpl\”attchen bekleben.\\
(a) Welche Seitenl\”ange muss ein solches Pl\”attchen haben?\\
(b) Wie viele braucht der/die Innenarchitekt/in davon?\\

\item Ein alter und ein neuer Skilift fahren parallel den Berg hoch.\\
Die Talstation ist auf $1650$ m.\”u.M. und die Bergstation ist auf $2100$ m.\”u.M.\\
Der alte Lift hat eine Steiggeschwindigkeit von $v_{a}=3$ km/h.\\
Der neue Lift hat eine Steiggeschwindigkeit von $v_{n}=5.4$ km/h.\\
(a) Wie lange braucht ein altes “S\”asseli” bis es wieder an der gleichen Stelle ist?\\
(b) Wie lange braucht ein neues “S\”asseli” bis es wieder an der gleichen Stelle ist?\\
(c) Wenn ein altes und ein neues “S\”asseli” gleichzeitig an der Talstation starten,\\
wie lange dauert es, bis sie zum n\”achsten Mal gemeinsam an der Talstation wegfahren?

\item Denke an eine rechteckige Schokoladetafel mit mehreren “Reiheli”.\\
(a) Warum gibt es keine, welche $3,5,7,11,13,17,19,23$ oder $29$ “T\”afeli” hat?\\
Begr\”unde Deine Antwort in kurzen S\”atzen.\\
(b) Als Ingenieur/Ingenieuse einer Schokoladefabrik erh\”alst Du folgenden Auftrag:\\
Es soll eine Tafel Schokolade hergestellt werden, die nicht mehr als $30$ “T\”afeli” hat.\\
Es sollen m\”oglichst viele Leute eine Tafel gerecht unter sich aufteilen k\”onnen.\\
Wie viele “T\”afeli” \emph{muss} die Schokoladetafel haben und wieviele Reiheli \emph{kann} sie haben?
\”Uberzeuge den Chef der Fabrik mit stichhaltigen Argumenten.

\end{enumerate}
\end{document}% https://blogs.ethz.ch/rindi

Prüfungsvorlage Bogen A | ggT (grösster gemeinsamer Teiler) | kgV (kleinstes gemeinsame Vielfache) |

Eine Prüfungsvorlage in pdf: Prüfung-ggT-kgV-a.pdf

Die Lösung in pdf: Lösung-ggtT-kgV-bogen-a.pdf

Anbei die LaTeX Version:

% A. PRAEAMBEL        http://blogs.ethz.ch/rindi/
% ************************************************
\documentclass[smallheadings,headsepline,12pt,a4paper]{scrartcl}
\usepackage[ngerman, french]{babel}
\usepackage[applemac]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{hyperref}
\usepackage[pdftex]{graphicx}
\pagestyle{plain}
\clubpenalty = 10000
\widowpenalty = 10000
\selectlanguage{ngerman}
\begin{document}
% B. TEST/Pruefung          http://blogs.ethz.ch/rindi/
% ****************************************************
\titlehead{
\hfill Obwalden der \today}
\subject{
\sc{Pr\”ufungsbogen A}}
\title{\sc{- ggT – kgV -}}
\author{\sc{Klasse 1}}
\date{Kantonsschule}
\maketitle
% B. DOKUMENT      http://blogs.ethz.ch/rindi/
% *************************************************
\begin{center}
\begin{tabular}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}
\hline
Aufgabe &1&2&3&4&5&6&7&8&9&10&11&12&13 &Total\\
\hline
Punkte  &1&1&1&1&2&2&2&2&1&2&4&4&2 &25 \\
\hline
\end{tabular}
\end{center}
Du hast 90 Minuten Zeit. Achte auf eine saubere Darstellung. Der L\”osungsweg muss klar
ersichtlich sein, dazu geh\”ort: die gesuchte Variable ist klar gekennzeichnet, die Rechnung
ist vorhanden und sauber gel\”ost und am Schluss steht ein Antwortsatz. Viel Erfolg!

\begin{enumerate}
\item Was sind “Nat\”urliche Zahlen”?

\item Defniniere mathematisch “Vielfaches einer Nat\”urlichen Zahl”.

\item Defniniere mathematisch “Teiler einer Nat\”urlichen Zahl”.

\item Was ist eine “Primzahl”?

\item Definiere mathematisch den “ggT” \emph{und} mache ein einfaches Beispiel dazu.

\item Definiere mathematisch das “kgV” \emph{und} mache ein einfaches Beispiel dazu.

\item Errechne:
(a) $ggT(72,324)\quad$(b) $ggT(432,288,672)$

\item Errechne:
(a) $kgV(72,324)\quad$ (b) $kgV(51,36,102)$

\item Zwei \emph{gleichnennrige} Br\”uche k\”onnen bekanntlich sehr einfach addiert werden.

Berechne $x=\frac{5}{72}+\frac{11}{324}$, indem Du die Br\”uche mit Hilfe des kgVs \emph{gleichnennrig} machst.

\item Zwei Stoffbahnen sind 232 cm und 174 cm lang. Sie sind so zu zerschneiden,
dass daraus m\”oglichst grosse, gleich lange Bahnen entstehen und kein Restst\”uck bleibt.\\
Wie lang wird eine solche Stoffbahn?

\item Ein alter und ein neuer Skilift fahren parallel den Berg hoch.
Die Talstation ist auf $1650$ m.\”u.M. und die Bergstation ist auf $2100$ m.\”u.M.\\
Der alte Lift hat eine Steiggeschwindigkeit von $v_{a}=3$ km/h.\\
Der neue Lift hat eine Steiggeschwindigkeit von $v_{n}=5.4$ km/h.\\
(a) Wie lange braucht ein altes “S\”asseli” bis es wieder an der gleichen Stelle ist?\\
(b) Wie lange braucht ein neues “S\”asseli” bis es wieder an der gleichen Stelle ist?\\
(c) Wenn ein altes und ein neues “S\”asseli” gleichzeitig an der Talstation starten,\\
wie lange dauert es, bis sie zum n\”achsten Mal gemeinsam an der Talstation wegfahren?\\

\item Denke an eine rechteckige Schokoladetafel mit “Reiheli”.\\
(a) Warum gibt es keine, welche $3,5,7,11,13,17,19,23$ oder $29$ “T\”afeli” hat?\\
Begr\”unde Deine Antwort in kurzen S\”atzen.\\
(b) Als Ingenieur/Ingenieuse einer Schokoladefabrik erh\”alst Du folgenden Auftrag:
Es soll eine Tafel Schokolade hergestellt werden, die nicht mehr als $30$ “T\”afeli” hat.
Es sollen m\”oglichst viele Leute eine Tafel gerecht unter sich aufteilen k\”onnen.
Wie viele “T\”afeli” muss die Schokoladetafel haben und wieviele Reiheli kann sie haben?
\”Uberzeuge den Chef der Fabrik mit stichhaltigen Argumenten.\\

\item Ein(e) Innenarchitekt(in) will eine  92 cm lange und  68 cm breite Tischplatte
mit m\”oglichst grossen, quadratischen Mosaikpl\”attchen bekleben.\\
(a) Welche Seitenl\”ange muss ein solches Pl\”attchen haben?\\
(b) Wie viele braucht der/die Innenarchitekt/in davon?

\end{enumerate}
\end{document} %http://blogs.ethz.ch/rindi/

Übungsvorlage | Funktionentheorie

Übungsvorlage in pdf: Übungsblatt_Funktionen.pdf

Anbei die Version in LaTeX:

% A. PR{\”{a}}AMBEL https://blogs.ethz.ch/rindi/
% ***********************************************

\documentclass[smallheadings,headsepline,12pt,a4paper]{scrartcl}
\usepackage[ngerman, french]{babel}
\usepackage[applemac]{inputenc} % teilt LaTeX die Texcodierung mit. Bei Windowssystemen: ansinew
\usepackage[T1]{fontenc}
\usepackage{hyperref}
\usepackage[pdftex]{graphicx}
\usepackage{multicol}
\usepackage{color}
\usepackage[dvips]{geometry}
\pagestyle{plain}
\clubpenalty = 10000
\widowpenalty = 10000
\selectlanguage{ngerman}

\begin{document}

% B. TITEL  https://blogs.ethz.ch/rindi/
% ********************************************

\titlehead{
\hfill Locarno der \today}
\subject{
\sc{{\”{u}}bungen\\Algebra Klasse 3d}}
\title{\sc{- Funktionen -}}
\author{\sc{Kantonsschule am Berg}\\
}
\date{2006}
\maketitle

% C. UEBUNGEN  https://blogs.ethz.ch/rindi/
% ********************************************

\textbf{Definition:}\\

Eine Funktion ist eine Beziehung von einem Definitionsbereich $\mathbf{D}$ zu einem Wertebereich $\mathbf{W}$, bei der jedem Element aus $\mathbf{D}$ \emph{genau ein} Element aus $\mathbf{W}$ zu geordnet ist.\\
\\
Man schreibt:\\

$f: \mathbf{D}\longrightarrow  \mathbf{W}$ \qquad
$x \longmapsto f(x)$\\
\\

\textbf{Beispiel 1} Es soll zwischen 10 und
20 Uhr der Temperaturverlauf an
einem sch{\”{o}}nen Sommertag (mit einem kurzen Gewitterschauer um
15 Uhr) eingetragen werden.
\begin{figure}[rh!]
\centering
\includegraphics[width=3.9cm]{Temp.jpg}
\caption{Tagestemperatur in Funktion der Zeit.}\label{Temp}
\end{figure}

\textbf{Beispiel 2} Ihr habt nun ein Beispiel f{\”{u}}r ein Schaubild einer
Funktion kennengelernt. Ein Begriff lernt sich am besten, wenn
auch Gegenbeispiele gebracht
werden:
\begin{figure}[rh!]
\centering
\includegraphics[width=4.5cm]{NichtTemp.jpg}
\caption{Gegenbeispiel einer Funktion.}\label{NichtTemp}
\end{figure}
Dies ist nicht das Schaubild eines
Temperaturverlaufs.\\

\textbf{Aufgabe 1.}\\
Warum ist die Kurve in Fig. \ref{NichtTemp} kein Schaubild einer Funktion?\\

\textbf{Aufgabe 2.}\\
Handelt es sich bei den Kurven in Fig. \ref{FunktionenNichtFunktionen} um Schaubilder (Graphen) von Funktionen?\\
\begin{figure}[rh!]
\centering
\includegraphics[width=12cm]{FunktionenNichtFunktionen.jpg}
\caption{{\”{u}}bung macht den Meister!}\label{FunktionenNichtFunktionen}
\end{figure}\\
\textbf{Aufgabe 3. }\\
F{\”{u}}r die folgenden Funktionen ist\\
\\
– eine ausf{\”{u}}hrliche Wertetabelle im angegebenen Berich zu berechnen\\
– der Graph zu zeichnen und zu beschreiben\\
– die Definitionsmenge anzugeben\\
– mit dem Graph die Wertemenge zu bestimmen\\
\\
a) $\qquad x \longmapsto f(x)=\mid 2x-1 \mid +1 \qquad  \qquad \mid x\mid \leq 5$\\
\\
b) $\qquad x \longmapsto f(x)=\frac{ 4 }{ x^{2}+4 }\qquad \qquad  \qquad \mid x\mid \leq 4$\\
\\
c) $\qquad x \longmapsto f(x)=1-x^2\qquad \qquad  \qquad \mid x\mid \leq 3$\\

\newpage

\vfill
“Das entscheidende Kriterium ist Sch{\”{o}}nheit; f{\”{u}}r h{\”{a}}ßliche Mathematik ist auf dieser Welt kein best{\”{a}}ndiger Platz.”\\
\\
Godfrey Harold Hardy

\nocite{*}
\bibliographystyle{plain}
\bibliography{bibGeolRegio}

\end{document}