„Sammelbilderproblem“ – Versionsunterschied
[gesichtete Version] | [gesichtete Version] |
→Würfel: Beispiel mit 2 Würfeln ergänzt |
Einarbeitung von weiteren Kommentaren aus Review |
||
Zeile 1: | Zeile 1: | ||
[[Datei:Basketball-sammelkarten hg.jpg|mini|Basketball-Sammelbilder]] |
[[Datei:Basketball-sammelkarten hg.jpg|mini|Basketball-Sammelbilder]] |
||
Das '''Sammelbilderproblem''', '''Sammler-Problem''', '''Sammelalben-Problem''' (englisch {{lang|en|'''Coupon Collector's Problem'''}}) befasst sich mit der Fragestellung, wie viele Bilder einer [[Sammelbild]]serie zu kaufen sind, um |
Das '''Sammelbilderproblem''', '''Sammler-Problem''', '''Sammelalben-Problem''' oder '''Problem der vollständigen Serie''' (englisch {{lang|en|'''Coupon Collector's Problem'''}}) befasst sich mit der Fragestellung, wie viele Bilder einer [[Sammelbild]]serie zu kaufen sind, um ein [[Sammelalbum]] vervollständigen zu können. |
||
Beim klassischen Sammelbilderproblem wird davon ausgegangen, dass alle Bilder verdeckt gekauft werden und gleich häufig vorkommen. Die letztere Voraussetzung ist aber beispielsweise bei [[Sammelkartenspiel]]en, auch ''Trading Card Games'' genannt, nicht erfüllt, da hier das Vorkommen der einzelnen Karten teilweise stark variiert. Eine weitere wichtige Rolle spielt die Möglichkeit des Nachkaufens und Tauschens von Karten. Mit Hilfsmitteln der [[Wahrscheinlichkeitstheorie]] sowie [[Monte-Carlo-Simulation]]en können Sammelstrategien optimiert werden, um das Sammelalbum möglichst kostengünstig zu füllen. |
Beim klassischen Sammelbilderproblem wird davon ausgegangen, dass alle Bilder verdeckt gekauft werden und gleich häufig vorkommen. Die letztere Voraussetzung ist aber beispielsweise bei [[Sammelkartenspiel]]en, auch ''Trading Card Games'' genannt, nicht erfüllt, da hier das Vorkommen der einzelnen Karten teilweise stark variiert. Eine weitere wichtige Rolle spielt die Möglichkeit des Nachkaufens und Tauschens von Karten. Mit Hilfsmitteln der [[Wahrscheinlichkeitstheorie]] sowie [[Monte-Carlo-Simulation]]en können Sammelstrategien optimiert werden, um das Sammelalbum möglichst kostengünstig zu füllen. |
||
Das Sammelbilderproblem ist insbesondere aufgrund der Beliebtheit der Fussball-Sammelalben eines der wenigen mathematischen Probleme, über das regelmäßig in den Massenmedien berichtet und diskutiert wird. |
|||
== Geschichte == |
== Geschichte == |
||
Zeile 13: | Zeile 15: | ||
== Das klassische Sammelbilderproblem == |
== Das klassische Sammelbilderproblem == |
||
Im klassischen Sammelbilderproblem soll die Frage beantwortet werden, wie viele Sammelbilder ein Einzelsammler im Mittel kaufen muss, um eine vollständige Serie von <math>n</math> Sammelbildern zu erhalten, wenn Tauschen und Nachkaufen ausgeschlossen ist und er jedes Bild einzeln kauft.<ref>[[Norbert Henze]]: ''Stochastik für Einsteiger.'' 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 192 ff. |
Im klassischen Sammelbilderproblem soll die Frage beantwortet werden, wie viele Sammelbilder ein Einzelsammler im Mittel kaufen muss, um eine vollständige Serie von <math>n</math> Sammelbildern zu erhalten, wenn Tauschen und Nachkaufen ausgeschlossen ist und er jedes Bild einzeln kauft.<ref name="Henze" >[[Norbert Henze]]: ''Stochastik für Einsteiger.'' 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 192 ff.</ref> Schon Pólya hatte die klassische Aufgabenstellung definiert und wie folgt begründet: „Die Käufer tauschen ihre Bilder aus oder werfen sie fort, der Verkäufer kann ein Bild vorenthalten usw. Wie man sieht, kann die Nichterfüllung der Voraussetzungen sowohl die eine als auch die andere Partei begünstigen und eben deshalb scheint mir die Berechnung der Durchschnittszahl unter den besagten Voraussetzungen zumindest als erste Orientierung einen gewissen Wert zu haben“.<ref name="Polya"></ref> |
||
Der [[Ergebnisraum]] kann als Menge der möglichen Sammelbilderfolgen definiert werden: |
Der [[Ergebnisraum]] kann als Menge der möglichen Sammelbilderfolgen definiert werden: |
||
Zeile 22: | Zeile 24: | ||
=== Wartezeit auf das nächste neue Bild === |
=== Wartezeit auf das nächste neue Bild === |
||
Die [[Zufallsvariable]] <math>X_i(\omega)</math> ordnet jedem Ergebnis <math>\omega\in\Omega</math> die Anzahl der Käufe zu, die gemacht werden müssen, um nach der <math>(i-1)</math>-ten verschiedenen Karte wieder eine neue, von den bisher gekauften verschiedene <math>i</math>-te Karte zu bekommen. Dies entspricht der Wartezeit auf das nächste neue Bild. |
Die [[Zufallsvariable]] <math>X_i(\omega)</math> ordnet jedem Ergebnis <math>\omega\in\Omega</math> die Anzahl der Käufe zu, die gemacht werden müssen, um nach der <math>(i-1)</math>-ten verschiedenen Karte wieder eine neue, von den bisher gekauften verschiedene <math>i</math>-te Karte zu bekommen. Dies entspricht der Wartezeit auf das nächste neue Bild.<ref>Elke Warmuth, Walter Warmuth: ''Elementare Wahrscheinlichkeitsrechnung: Vom Umgang mit dem Zufall''. Vieweg + Teubner 1998, ISBN 9783519002253, S. 128–129</ref> |
||
[[Datei:Coupon collectors problem simulation.svg|mini|[[Histogramm]] einer [[Simulation]] (100.000 Realisierungen) des klassischen [[Pokémon]]-Problems. Man erkennt die große Streuung: Im schlechtesten Fall mussten 2522 Karten gekauft werden.]] |
[[Datei:Coupon collectors problem simulation.svg|mini|[[Histogramm]] einer [[Simulation]] (100.000 Realisierungen) des klassischen [[Pokémon]]-Problems. Man erkennt die große Streuung: Im schlechtesten Fall mussten 2522 Karten gekauft werden.]] |
||
Da beim ersten Kauf sicher ein neues Bild kommt, ist die Wahrscheinlichkeit <math>P(X_1=1)=1</math> . Beim Kauf des zweiten Bildes ist sie <math>P(X_2=1)=(n-1)/n</math>. Diese Zufallsvariable ist [[geometrische Verteilung|geometrisch verteilt]]. Allgemein ergibt sich: |
Da beim ersten Kauf sicher ein neues Bild kommt, ist die Wahrscheinlichkeit <math>P(X_1=1)=1</math> . Beim Kauf des zweiten Bildes ist sie <math>P(X_2=1)=(n-1)/n</math>. Diese Zufallsvariable ist [[geometrische Verteilung|geometrisch verteilt]]. Allgemein ergibt sich: |
||
Zeile 54: | Zeile 56: | ||
Sammelbilder werden in der Regel nicht einzeln, sondern in Päckchen (häufig auch Tüten oder Booster genannt) verkauft. Dabei wird vom Hersteller garantiert, dass innerhalb eines Päckchens kein Bild mehrfach vorkommt. |
Sammelbilder werden in der Regel nicht einzeln, sondern in Päckchen (häufig auch Tüten oder Booster genannt) verkauft. Dabei wird vom Hersteller garantiert, dass innerhalb eines Päckchens kein Bild mehrfach vorkommt. |
||
Die allgemeine Lösung ist kompliziert<ref>Wolfgang Stadje: ''The Collector's Problem with Group Drawings'', Advances in Applied Probability, Vol. 22, No. 4 (Dec., 1990), pp. 866-882</ref> |
Die allgemeine Lösung ist kompliziert<ref>Wolfgang Stadje: ''The Collector's Problem with Group Drawings'', Advances in Applied Probability, Vol. 22, No. 4 (Dec., 1990), pp. 866-882</ref><ref name="Henze" />, aber der Vergleich der Ergebnisse ergibt, dass der Effekt der Päckchen eher gering ist, wenn die Päckchengröße im Verhältnis zur Gesamtzahl der Sammelbilder klein ist. Dies bedeutet für die meisten praktischen Anwendungen, dass die Päckchengröße vernachlässigt werden kann, denn die Wahrscheinlichkeit <math>P_D</math>, dass es in einem Päckchen mindestens eine doppelte Karte gibt, beträgt wie beim [[Geburtstagsparadoxon]] |
||
: <math>P_D = 1- \left( \frac{n}{n} \cdot\frac{n-1}{n} \cdot \frac{n-2}{n} \dotsm \frac{n-p+1}{n}\right)</math>. |
: <math>P_D = 1- \left( \frac{n}{n} \cdot\frac{n-1}{n} \cdot \frac{n-2}{n} \dotsm \frac{n-p+1}{n}\right)</math>. |
||
Zeile 68: | Zeile 70: | ||
Die meisten Hersteller bieten an, dass eine bestimmte Anzahl <math>K</math> von Bildern (häufig 50) nachgekauft werden kann, in der Regel zu einem erhöhten Preis. Außerdem kann man gezielt bestimmte Sammelbilder kaufen, z. B. in speziellen Sammlerbörsen oder Online-Shops. Die wichtige Frage ist, wann sich Nachkaufen lohnt. |
Die meisten Hersteller bieten an, dass eine bestimmte Anzahl <math>K</math> von Bildern (häufig 50) nachgekauft werden kann, in der Regel zu einem erhöhten Preis. Außerdem kann man gezielt bestimmte Sammelbilder kaufen, z. B. in speziellen Sammlerbörsen oder Online-Shops. Die wichtige Frage ist, wann sich Nachkaufen lohnt. |
||
Fehlen noch <math>x</math> Bilder und ein bestimmtes Bild wird zum Preis von <math>k</math> angeboten, so lohnt sich der Kauf, wenn im Mittel die Kosten geringer sind als die Kosten für das das nächste Bild beim normalen Sammeln. Sei <math>b</math> der normale Preis einen einzelnen Bildes, so lohnt sich der Kauf, wenn |
Fehlen noch <math>x</math> Bilder und ein bestimmtes Bild wird zum Preis von <math>k</math> angeboten, so lohnt sich der Kauf, wenn im Mittel die Kosten geringer sind als die Kosten für das das nächste Bild beim normalen Sammeln. Sei <math>b</math> der normale Preis einen einzelnen Bildes, so lohnt sich der Kauf<ref name="Braband"></ref> , wenn |
||
: <math>b\frac{n}{x}>k</math>. |
: <math>b\frac{n}{x}>k</math>. |
||
Zeile 85: | Zeile 87: | ||
=== Optimierte Sammelstrategie === |
=== Optimierte Sammelstrategie === |
||
[[File:Sammelbilder-Display.JPG|mini|Ein Display (auch Box genannt) der Sammelbilderserie "Mission Tierfreunde".]] |
[[File:Sammelbilder-Display.JPG|mini|Ein Display (auch Box genannt) der Sammelbilderserie "Mission Tierfreunde".]] |
||
Für die Kombination von Tauschen und Nachkaufen gibt es bisher keine analytischen Ergebnisse. Per Simulation wurde nachgewiesen |
Für die Kombination von Tauschen und Nachkaufen gibt es bisher keine analytischen Ergebnisse. Per Simulation wurde nachgewiesen<ref name="Sardy" />, dass das Potenzial solcher optimierter Strategien erheblich ist. Es wird allerdings davon ausgegangen, dass in einem Display (das sind Verpackungen für den Handel mit 50 oder 100 Päckchen) keine Doppelten vorkommen. |
||
Die Empfehlung aufgrund der Simulationsergebnisse ist die folgende optimierte Sammelstrategie: |
Die Empfehlung aufgrund der Simulationsergebnisse ist die folgende optimierte Sammelstrategie: |
||
Zeile 93: | Zeile 95: | ||
# Nachkauf (am Schluss) der maximal erlaubten Zahl von Bildern beim Hersteller |
# Nachkauf (am Schluss) der maximal erlaubten Zahl von Bildern beim Hersteller |
||
In einem [[Jugend forscht|Jugend-forscht]]-Projekt |
In einem [[Jugend forscht|Jugend-forscht]]-Projekt wurde 2016 für das Szenario „faires Tauschen mit Nachkaufen“ der Faktor <math>f = \frac{S}{mn}</math> durch umfangreiche Simulationen untersucht, wobei <math>S</math> die mittlere Anzahl insgesamt zu kaufender Bilder aller Tauschpartner ist. |
||
Der Faktor <math>f</math> gibt mithin an, wieviel mal mehr Bilder |
Der Faktor <math>f</math> gibt mithin an, wieviel mal mehr Bilder jeder Sammler am Ende im Mittel gekauft hat, als das vollständige Album Bilder enthält. |
||
Während ohne Tauschen und Nachkaufen |
Während ohne Tauschen und Nachkaufen der Faktor für einen Einzelsammler gut durch den natürlichen Logarithmus der Anzahl der Sammelbilder angenähert werden kann (bzw. dem doppelten Logarithmus für eine große Anzahl von Tauschpartnern), |
||
konnten sie plausibel experimentell belegen, dass bei fairem Tauschen mit Nachkaufen, bei festem Nachkaufprozentsatz, |
konnten sie plausibel experimentell belegen, dass bei fairem Tauschen mit Nachkaufen, bei festem Nachkaufprozentsatz, |
||
<math>f \to 1</math> strebt, wenn die Anzahl der tauschenden Sammler <math>m \to \infty</math> strebt.<ref>Niklas Braband, Sonja Braband und Malte Braband: [https://arxiv.org/ftp/arxiv/papers/1504/1504.00296.pdf Neue Ergebnisse für das Sammelbilderproblem mit Tauschen und Nachkaufen], Gymnasium Neue Oberschule, Braunschweig, und Technische Universität Braunschweig, 2016</ref> |
<math>f \to 1</math> strebt, wenn die Anzahl der tauschenden Sammler <math>m \to \infty</math> strebt.<ref name="Braband">Niklas Braband, Sonja Braband und Malte Braband: [https://arxiv.org/ftp/arxiv/papers/1504/1504.00296.pdf Neue Ergebnisse für das Sammelbilderproblem mit Tauschen und Nachkaufen], Gymnasium Neue Oberschule, Braunschweig, und Technische Universität Braunschweig, 2016</ref> |
||
===Kritik=== |
|||
Auch konnten Sie nachweisen, dass bei der Verpackung von Displays systematische Abweichungen bzw. Muster entstehen, die sich signifikant vom zufälligen Mischen unterscheiden. |
|||
Die Annahmen des klassischen Sammelbilderproblems werden häufig als unrealistisch kritisiert und insbesondere im Internet kursieren Gerüchte, dass die Hersteller entweder Bilder künstlich verknappen oder die Bilder nicht ordentlich mischen, d. h. zu viele Doppelte vorkommen oder manche Bilder zu selten. |
|||
Ein Journalist von [[Spiegel online]] untersuchte die Annahmen für das Sammelalbum zur [[Fußball-Weltmeisterschaft 2014]] zusammen mit der [[Website]] ''stickermanager.com''. Durch die Betrachtung des aufbereiteten Datenbestandes von 8,33 Millionen Einträgen kam der Statistiker [[Christian Hesse (Mathematiker)|Christan Hesse]] zu dem Ergebnis: „''Die gravierenden Unterschiede lassen sich mit dem Wirken des Zufalls allein nicht erklären''“. Dabei wurde angenommen, dass die Online-Umfrage repräsentativ ist. Allerdings galt dies nur für die deutsche Edition, z. B. bei der [[Schweiz]]er Edition, die separat produziert wird und optisch unterscheidbar ist, traten die 2,36 Millionen registrierten Sticker gleichmäßig häufig auf.<ref>[http://www.spiegel.de/wissenschaft/mensch/panini-wm-sticker-millionen-stichprobe-zeigt-ungleichverteilung-a-975517.html Panini-WM-Sticker: Millionen-Stichprobe zeigt massive Ungleichverteilung], [[Spiegel online]], 19. Juni 2014. Abgerufen 19. Juni 2014.</ref> In einer systematischen Untersuchung des Herstellungsprozesses<ref>Niklas Braband, Sonja Braband und Malte Braband: [http://arxiv.org/pdf/1603.03008v1.pdf Zur Gültigkeit der Annahmen des klassischen Sammelbilderproblems], Gymnasium Neue Oberschule, Braunschweig, und Technische Universität Braunschweig, 2016</ref> konnte nachgewiesen werden, dass bei der Verpackung von Displays systematische Abweichungen bzw. Muster entstehen, die sich signifikant vom zufälligen Mischen unterscheiden. Dies wirkt sich allerdings nicht machteilig für den Sammler aus. |
|||
== Das allgemeine Sammelbilderproblem == |
== Das allgemeine Sammelbilderproblem == |
||
Zeile 135: | Zeile 140: | ||
Kann man 50 Bilder nachkaufen, spart man etwa 3060 Bilder, d. h. dann braucht man näherungsweise im Mittel nur 1768 Karten zu kaufen sowie 50 Nachkaufkarten. Dies kostet dann etwa 257 € bei 20 Cent pro Nachkaufbild (ohne Berücksichtigung des Päckchen-Effekts). Auch die Standardabweichung sinkt auf etwa 82 Bilder, d. h. in etwa 95,4% aller Fälle müsste ein Einzelsammler zwischen 1604 und 1936 Bilder sammeln. |
Kann man 50 Bilder nachkaufen, spart man etwa 3060 Bilder, d. h. dann braucht man näherungsweise im Mittel nur 1768 Karten zu kaufen sowie 50 Nachkaufkarten. Dies kostet dann etwa 257 € bei 20 Cent pro Nachkaufbild (ohne Berücksichtigung des Päckchen-Effekts). Auch die Standardabweichung sinkt auf etwa 82 Bilder, d. h. in etwa 95,4% aller Fälle müsste ein Einzelsammler zwischen 1604 und 1936 Bilder sammeln. |
||
Bei einer unendlich großen Sammelgemeinschaft wäre der Faktor für jeden Sammler etwa 1,88, d. h. jeder müsste im Mittel etwa 1275 Bilder kaufen, was einem Preis von etwa 179€ entspricht. Für das WM-Album 2014 wurde abgeschätzt,<ref name="Sardy" /> dass man mit einer optimierten Sammelstrategie das Sammelalbum für etwa 125 € füllen kann. Berücksichtigt man die Preiserhöhung und die zusätzlichen Sammelbilder des EM-Albums, so ergibt sich mit dieser Strategie ein Preis von etwa 150 €. |
Bei einer unendlich großen Sammelgemeinschaft wäre der Faktor für jeden Sammler etwa 1,88, d. h. jeder müsste im Mittel etwa 1275 Bilder kaufen, was einem Preis von etwa 179€ entspricht. Für das WM-Album 2014 wurde abgeschätzt,<ref name="Sardy" /> dass man mit einer optimierten Sammelstrategie das Sammelalbum für etwa 125 € füllen kann. Berücksichtigt man die Preiserhöhung und die zusätzlichen Sammelbilder des EM-Albums, so ergibt sich mit dieser Strategie ein Preis von etwa 150 €.<ref>{{Internetquelle | url=http://dw.com/p/1ImC2 | titel=Das Einmaleins der Panini Sticker | hrsg=[[Deutsche Welle]] | werk=dw.com | datum=2016-05-12 | zugriff=2016-05-14}}</ref> Im Grenzfall des konsequenten Nachkaufens mit einer endlich großen Sammelgemeinschaft würden sich |
||
98,20 € pro Sammler ergeben<ref name="Braband" />. |
|||
== Einzelnachweise == |
== Einzelnachweise == |
||
<references/> |
<references/> |
Version vom 15. Mai 2016, 07:26 Uhr
Das Sammelbilderproblem, Sammler-Problem, Sammelalben-Problem oder Problem der vollständigen Serie (englisch Coupon Collector's Problem) befasst sich mit der Fragestellung, wie viele Bilder einer Sammelbildserie zu kaufen sind, um ein Sammelalbum vervollständigen zu können.
Beim klassischen Sammelbilderproblem wird davon ausgegangen, dass alle Bilder verdeckt gekauft werden und gleich häufig vorkommen. Die letztere Voraussetzung ist aber beispielsweise bei Sammelkartenspielen, auch Trading Card Games genannt, nicht erfüllt, da hier das Vorkommen der einzelnen Karten teilweise stark variiert. Eine weitere wichtige Rolle spielt die Möglichkeit des Nachkaufens und Tauschens von Karten. Mit Hilfsmitteln der Wahrscheinlichkeitstheorie sowie Monte-Carlo-Simulationen können Sammelstrategien optimiert werden, um das Sammelalbum möglichst kostengünstig zu füllen.
Das Sammelbilderproblem ist insbesondere aufgrund der Beliebtheit der Fussball-Sammelalben eines der wenigen mathematischen Probleme, über das regelmäßig in den Massenmedien berichtet und diskutiert wird.
Geschichte
Sammelbilder haben eine lange Tradition, schon im 19. Jahrhundert gab es Sammelbilder als Produktzugaben z. B. bei Schokolade oder Zigaretten. Eine Variante bestand darin, dass Coupons gesammelt werden mussten und der Sammler nach Einsendung einer vollständigen Serie eine Prämie erhielt.[1] In den 1930-er Jahren erschienen Bilder von Film- oder Sportstars auf der Deckel-Innenseite von Eiscreme-Packungen.[2] Aber es gab auch schon früh andere Sammelobjekte, z. B. Buttons oder Figuren in Cornflakes-Packungen.[3] Erst in den 1960-er Jahren haben sich vermehrt Sammelalben etabliert, bei denen die Bilder verdeckt in Tüten oder Päckchen verkauft wurden, d. h. ohne dass der Sammler weiß, welche Bilder er erhält. Mit der Einführung von Fußballsammelalben, vorangetrieben durch die Firma Panini, wurde das Sammeln zu einem Massenphänomen, insbesondere zu Fußball-Welt- oder Europameisterschaften. Mittlerweile sind Sammelalben zu Standard-Merchandising-Artikeln z. B. für Kinofilme geworden.
Die grundlegenden kombinatorischen Betrachtungen gehen bereits auf Markow zurück.[4] Die konkrete mathematische Behandlung begann 1930 mit George Pólya, der das Problem aus Sicht des Herstellers darstellt: „Jede Packung unserer Ware enthält zwei verschiedene Blumenbilder; die volle Kollektion umfasst 72 verschiedene Blumenbilder; wer eine volle Kollektion sammelt und einsendet, erhält kostenlos eine Prämie. Der Verkäufer, der solche Reklame macht, muss sich vernünftigerweise die Frage vorlegen: Wie groß ist die Durchschnittszahl der verkauften Packungen pro Prämie?“[1] Diese Arbeit prägte daher den Namen als Coupon Collector's Problem. Teilweise wurde es auch als Dixie Cup Problem[5] bezeichnet (nach den Eiskrembechern, die nach der Herstellerfirma als Dixie Cup bezeichnet wurden). Beginnend mit William Fellers Standardwerk zur Wahrscheinlichkeitstheorie[6] haben sich zahlreiche Mathematiker mit dem Sammelbilderproblem beschäftigt. Dadurch hat sich das Sammelbilderproblem als klassische mathematische Aufgabenstellung etabliert.
Manchmal wird die Aufgabenstellung auch als Sammelbilderparadoxon bezeichnet. Dies rührt daher, dass überraschend viele Bilder benötigt werden, wenn man das Sammelalbum ohne Tauschen oder Nachkaufen vervollständigen möchte. Für Pólyas Blumenbilder-Kollektion muss man im Durchschnitt 174 Päckchen, also 348 Blumenbilder sammeln (bei nur 72 unterschiedlichen Bildern), für das aktuelle Sammelalbum zur EURO 2016 benötigt man sogar 4828 Bilder (bei 680 unterschiedlichen Bildern). Dieses Paradoxon kann dadurch erklärt werden, dass das Verhältnis der im Mittel benötigten Bilder zur Anzahl der unterschiedlichen Bilder stärker als linear anwächst.
Das klassische Sammelbilderproblem
Im klassischen Sammelbilderproblem soll die Frage beantwortet werden, wie viele Sammelbilder ein Einzelsammler im Mittel kaufen muss, um eine vollständige Serie von Sammelbildern zu erhalten, wenn Tauschen und Nachkaufen ausgeschlossen ist und er jedes Bild einzeln kauft.[7] Schon Pólya hatte die klassische Aufgabenstellung definiert und wie folgt begründet: „Die Käufer tauschen ihre Bilder aus oder werfen sie fort, der Verkäufer kann ein Bild vorenthalten usw. Wie man sieht, kann die Nichterfüllung der Voraussetzungen sowohl die eine als auch die andere Partei begünstigen und eben deshalb scheint mir die Berechnung der Durchschnittszahl unter den besagten Voraussetzungen zumindest als erste Orientierung einen gewissen Wert zu haben“.[1]
Der Ergebnisraum kann als Menge der möglichen Sammelbilderfolgen definiert werden:
- .
Mathematisch entspricht das Sammelbilderproblem einem Urnenmodell mit Zurücklegen und zwar bedeuten die gezogenen Zahlen die Nummern der Sammelbilder. Gesucht wird die Anzahl der Ziehungen, die nötig ist, bis jede Zahl mindestens einmal gezogen wurde. Dies bedeutet, dass die einzelnen gezogenen Nummern der Sammelbilder eine diskrete Gleichverteilung besitzen.
Wartezeit auf das nächste neue Bild
Die Zufallsvariable ordnet jedem Ergebnis die Anzahl der Käufe zu, die gemacht werden müssen, um nach der -ten verschiedenen Karte wieder eine neue, von den bisher gekauften verschiedene -te Karte zu bekommen. Dies entspricht der Wartezeit auf das nächste neue Bild.[8]
Da beim ersten Kauf sicher ein neues Bild kommt, ist die Wahrscheinlichkeit . Beim Kauf des zweiten Bildes ist sie . Diese Zufallsvariable ist geometrisch verteilt. Allgemein ergibt sich:
- .
Als Erwartungswert für ergibt sich:
- .
Dies bedeutet insbesondere, dass man, um das letzte fehlende Bild der Sammlung zu erhalten, im Mittel Bilder kaufen muss. Das sind aber genauso viele Bilder, wie man überhaupt sammeln muss und erklärt, warum das Sammeln ohne Tauschen und Nachkaufen so teuer ist.
Wahrscheinlichkeitsverteilung
Die Zufallsvariable
- ,
gibt an, wie viele Käufe gemacht werden müssen, um alle Karten zu besitzen. Dies ist eine Summe unabhängiger geometrisch verteilter Zufallsvariabler, die eine diskrete Phasenverteilung besitzt. Die Wahrscheinlichkeitsverteilung kann durch Auswertung der zugehörigen Markow-Kette[9] oder rekursiv[10] berechnet werden.
Erwartungswert
Da die einzelnen Erwartungswerte der existieren, existiert auch der Erwartungswert für die neue Zufallsvariable:
- .
Dann gilt:
ist die -te Partialsumme der harmonischen Reihe. ist also der Faktor, der angibt, wie viel mal mehr Bilder man kaufen muss im Vergleich zur Größe des Sammelalbums. Für große n gilt die Näherung durch den natürlichen Logarithmus: .
Päckchen
Sammelbilder werden in der Regel nicht einzeln, sondern in Päckchen (häufig auch Tüten oder Booster genannt) verkauft. Dabei wird vom Hersteller garantiert, dass innerhalb eines Päckchens kein Bild mehrfach vorkommt.
Die allgemeine Lösung ist kompliziert[11][7], aber der Vergleich der Ergebnisse ergibt, dass der Effekt der Päckchen eher gering ist, wenn die Päckchengröße im Verhältnis zur Gesamtzahl der Sammelbilder klein ist. Dies bedeutet für die meisten praktischen Anwendungen, dass die Päckchengröße vernachlässigt werden kann, denn die Wahrscheinlichkeit , dass es in einem Päckchen mindestens eine doppelte Karte gibt, beträgt wie beim Geburtstagsparadoxon
- .
Varianz
Da die Wartezeiten auf die jeweils nächsten neuen Bilder geometrisch verteilt und unabhängig sind, ergibt sich mit für die Varianz der Anzahl der zu sammelnden Bilder
In der Abbildung wächst die Standardabweichung mit stark an.
Nachkaufen
Die meisten Hersteller bieten an, dass eine bestimmte Anzahl von Bildern (häufig 50) nachgekauft werden kann, in der Regel zu einem erhöhten Preis. Außerdem kann man gezielt bestimmte Sammelbilder kaufen, z. B. in speziellen Sammlerbörsen oder Online-Shops. Die wichtige Frage ist, wann sich Nachkaufen lohnt.
Fehlen noch Bilder und ein bestimmtes Bild wird zum Preis von angeboten, so lohnt sich der Kauf, wenn im Mittel die Kosten geringer sind als die Kosten für das das nächste Bild beim normalen Sammeln. Sei der normale Preis einen einzelnen Bildes, so lohnt sich der Kauf[12] , wenn
- .
Wenn die Möglichkeit besteht Bilder nachzukaufen, so lohnt es sich am meisten, diese komplett am Ende nachzukaufen. Man müsste sonst im Mittel[13]
Bilder kaufen, statt Bilder nachzukaufen, und dieser Spareffekt kann sehr groß sein.[14]
Tauschen
Eine weitere wichtige Erweiterung ist das Tauschen von Doppelten. Dies geschieht traditionell im Freundeskreis, zunehmend aber auch in organisierten Tauschbörsen z. B. über das Internet. In der mathematischen Modellierung wird in der Regel das faire Tauschen betrachtet, d. h. es wird jeweils ein Bild gegen ein anderes getauscht. Auch wird angenommen, dass die Tauschpartner kooperieren und solange gemeinsam sammeln und fair tauschen, bis jeder Sammler sein Album gefüllt hat. Dies entspricht dem Fall, als ob ein Sammler Sammelalben vervollständigt.
Für diesen Fall wurde bisher keine geschlossene Lösung gefunden, am Beispiel des WM-Albums wurde per Simulation gezeigt[15], dass der Effekt erheblich ist. Asymptotisch gilt für den Mittelwert bei einer festen Anzahl von Tauschpartnern[5]
Dies zeigt den Effekt des Tauschens: während der erste Sammler im Mittel Karten kaufen muss[16], braucht jeder weitere Sammler im Mittel nur zusätzlich kaufen. Mit dieser Formel kann man grob abschätzen, wie viel Geld man durch das Tauschen sparen kann. Z. B. würden sich die Kosten für zwei Tauschpartner durch faires Tauschen auf etwa 60% der Kosten eines Einzelsammlers reduzieren.
Optimierte Sammelstrategie
Für die Kombination von Tauschen und Nachkaufen gibt es bisher keine analytischen Ergebnisse. Per Simulation wurde nachgewiesen[15], dass das Potenzial solcher optimierter Strategien erheblich ist. Es wird allerdings davon ausgegangen, dass in einem Display (das sind Verpackungen für den Handel mit 50 oder 100 Päckchen) keine Doppelten vorkommen.
Die Empfehlung aufgrund der Simulationsergebnisse ist die folgende optimierte Sammelstrategie:
- Kauf eines Displays
- Kauf weiterer Päckchen und Tausch möglichst vieler Bilder, bis nur noch die möglichen Nachkaufbilder fehlen
- Nachkauf (am Schluss) der maximal erlaubten Zahl von Bildern beim Hersteller
In einem Jugend-forscht-Projekt wurde 2016 für das Szenario „faires Tauschen mit Nachkaufen“ der Faktor durch umfangreiche Simulationen untersucht, wobei die mittlere Anzahl insgesamt zu kaufender Bilder aller Tauschpartner ist. Der Faktor gibt mithin an, wieviel mal mehr Bilder jeder Sammler am Ende im Mittel gekauft hat, als das vollständige Album Bilder enthält. Während ohne Tauschen und Nachkaufen der Faktor für einen Einzelsammler gut durch den natürlichen Logarithmus der Anzahl der Sammelbilder angenähert werden kann (bzw. dem doppelten Logarithmus für eine große Anzahl von Tauschpartnern), konnten sie plausibel experimentell belegen, dass bei fairem Tauschen mit Nachkaufen, bei festem Nachkaufprozentsatz, strebt, wenn die Anzahl der tauschenden Sammler strebt.[12]
Kritik
Die Annahmen des klassischen Sammelbilderproblems werden häufig als unrealistisch kritisiert und insbesondere im Internet kursieren Gerüchte, dass die Hersteller entweder Bilder künstlich verknappen oder die Bilder nicht ordentlich mischen, d. h. zu viele Doppelte vorkommen oder manche Bilder zu selten.
Ein Journalist von Spiegel online untersuchte die Annahmen für das Sammelalbum zur Fußball-Weltmeisterschaft 2014 zusammen mit der Website stickermanager.com. Durch die Betrachtung des aufbereiteten Datenbestandes von 8,33 Millionen Einträgen kam der Statistiker Christan Hesse zu dem Ergebnis: „Die gravierenden Unterschiede lassen sich mit dem Wirken des Zufalls allein nicht erklären“. Dabei wurde angenommen, dass die Online-Umfrage repräsentativ ist. Allerdings galt dies nur für die deutsche Edition, z. B. bei der Schweizer Edition, die separat produziert wird und optisch unterscheidbar ist, traten die 2,36 Millionen registrierten Sticker gleichmäßig häufig auf.[17] In einer systematischen Untersuchung des Herstellungsprozesses[18] konnte nachgewiesen werden, dass bei der Verpackung von Displays systematische Abweichungen bzw. Muster entstehen, die sich signifikant vom zufälligen Mischen unterscheiden. Dies wirkt sich allerdings nicht machteilig für den Sammler aus.
Das allgemeine Sammelbilderproblem
Im allgemeinen Sammelbilderproblem kann die Wahrscheinlichkeit für jedes Bild unterschiedlich sein, und zwar . Dies ist der allgemeinste Fall einer diskreten Wahrscheinlichkeitsverteilung. Die Lösung ist nicht mehr mit elementarer Wahrscheinlichkeitsrechnung herleitbar, sondern nur mit erzeugenden Funktionen. Für den Mittelwert ergibt sich[13]
- .
Hiermit kann man für einen Sammler ohne Nachkaufen die mittlere Anzahl benötigter Karten für Trading Card Games berechnen.
Beispiele
Würfel
Für pädagogische Zwecke wird häufig das Sammelbilderproblem mit Hilfe eines normalen Spielwürfels eingeführt und veranschaulicht.[19] In der Praxis könnte dies z. B. Sammelfiguren entsprechen, die einem Produkt beigemischt sind.
Man muss durchschnittlich 14,7 mal werfen, um jede Augenzahl mindestens einmal zu bekommen,[20] denn es gilt
- .
Nimmt man die Päckchengröße an (dies entspricht Würfeln mit zwei Würfeln unter Ausschluss eines Paschs), so erhält man
Augenzahlen, d. h. man muss im Durchschnitt mal würfeln, da mit einem Wurf zwei Würfel (mit verschiedenen Augenzahlen) geworfen werden. Es gilt , d. h. man kann erwarten, durch das Päckchen im Mittel mindestens ein Bild zu sparen.
Eine einfache Erweiterung besteht darin, mit zwei unterscheidbaren Würfel zu spielen und damit ein Sammelalbum mit Sammelbildern zu simulieren. Dies entspricht dem von REWE herausgegebenen offiziellen DFB-Sammelalbum zur Euro 2016, wobei die Sammelbilder hier eine Produktzugabe für je 10€ Einkaufswert darstellen und nicht nachgekauft werden können. Hier benötigt man als Einzelsammler zum Vervollständigen schon fast 150 Sammelbilder. Das Tauschen bekommt eine besondere Bedeutung, denn beim fairen Tauschen müsste jeder weitere Sammler dann nur etwa 67 Bilder sammeln, und das wäre gleichzeitig auch der Grenzwert bei sehr vielen Tauschpartnern.[5]
Pokémon
Es gebe 150 verschiedene Motive auf den Pokémon-Karten, die man kaufen muss und die Karten seien einzeln verpackt. Wenn es sich um ein klassisches Sammelalbum handeln würde, dann müsste ein Einzelsammler ohne Nachkaufen im Mittel ungefähr 839 Karten kaufen.
Allerdings ist Pokémon in Wirklichkeit ein Trading Card Spiel, d. h. es gibt mehr als 5 unterschiedliche Kartentypen mit unterschiedlichen Seltenheiten, von normal bis extrem selten. Den großen Unterschied kann man schon bei zwei Kartentypen erkennen, bei denen z. B. 30 von 150 Karten halb so häufig auftreten wie im klassischen Sammelbilderspiel. Dann müsste der Einzelsammler schon im Mittel etwa 1213 Karten kaufen. Gibt es 10 sehr seltene Karten, die zehnmal seltener auftreten, dann bräuchte er sogar etwa 4372 Karten. Dies bedeutet, dass Nachkaufen und Tauschen noch eine größere Bedeutung besitzen als bei den klassischen Sammelbildern.
Fußball-Sammelbilder
Das aktuelle Panini-Album zur Euro 2016 mit 680 Bildern kostet mindestens 95,20 € bei einem regulären Preis von 14 Cent pro Bild. Dies wäre gleichzeitig auch der erwartete Preis für das letzte fehlende Bild, wenn man es normal sammeln würde. Für den Faktor gilt , dies ergibt für einen Einzelsammler ohne Tauschen und Nachkaufen eine mittlere Anzahl zu kaufender Bilder von etwa 4828 (d. h. 965,5 Päckchen) und entspricht etwa 676 €. Aber auch die Standardabweichung ist groß (869 Bilder), d. h. in etwa 95,4 % aller Fälle müsste ein Einzelsammler zwischen 3090 und 6566 Bilder sammeln. Dies verdeutlicht, dass unbedingt getauscht und nachgekauft werden sollte, um die Kosten zu verringern.
Der Einfluss der Päckchen ist gering, bei 5-er Päckchen beträgt nur ungefähr 0,016, d. h. bei etwa jedem 60-ten Päckchen müsste man mal ein doppeltes Bild erwarten, wenn die Karten zufällig gemischt würden. Dieser Einfluss wird häufig überschätzt oder falsch eingeschätzt,[21] bei exakter Rechnung muss man im Mittel 963,2 Päckchen kaufen[22], d. h. die Ersparnis beträgt im Mittel nur 12 Bilder und kann daher auch in Anbetracht der großen Standardabweichung praktisch vernachlässigt werden.
Kann man 50 Bilder nachkaufen, spart man etwa 3060 Bilder, d. h. dann braucht man näherungsweise im Mittel nur 1768 Karten zu kaufen sowie 50 Nachkaufkarten. Dies kostet dann etwa 257 € bei 20 Cent pro Nachkaufbild (ohne Berücksichtigung des Päckchen-Effekts). Auch die Standardabweichung sinkt auf etwa 82 Bilder, d. h. in etwa 95,4% aller Fälle müsste ein Einzelsammler zwischen 1604 und 1936 Bilder sammeln.
Bei einer unendlich großen Sammelgemeinschaft wäre der Faktor für jeden Sammler etwa 1,88, d. h. jeder müsste im Mittel etwa 1275 Bilder kaufen, was einem Preis von etwa 179€ entspricht. Für das WM-Album 2014 wurde abgeschätzt,[15] dass man mit einer optimierten Sammelstrategie das Sammelalbum für etwa 125 € füllen kann. Berücksichtigt man die Preiserhöhung und die zusätzlichen Sammelbilder des EM-Albums, so ergibt sich mit dieser Strategie ein Preis von etwa 150 €.[23] Im Grenzfall des konsequenten Nachkaufens mit einer endlich großen Sammelgemeinschaft würden sich 98,20 € pro Sammler ergeben[12].
Einzelnachweise
- ↑ a b c George Pólya: Eine Wahrscheinlichkeitsaufgabe in der Kundenwerbung, ZAMM – Zeitschrift für Angewandte Mathematik und Mechanik, Band 10, Heft 1, 1930, S. 96–97
- ↑ NewsTimes: Commemorative Dixie cups can be collectibles, abgerufen am 28. April 2016
- ↑ Kellogs Memorabilia and Collectibles, abgerufen am 28. April 2016
- ↑ Andrei Andrejewitsch Markow: Wahrscheinlichkeitsrechnung, Teubner, Berlin, 1912, S. 101–108
- ↑ a b c Donald J. Newman, Lawrence Shepp: The double dixie cup problem, American Mathematical Monthly 67(1960), S. 58–61
- ↑ William Feller: An introduction to probability theory and its applications. Band 1: Wiley, New York 1950, S. 225, ISBN 0-471-25708-7
- ↑ a b Norbert Henze: Stochastik für Einsteiger. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 192 ff.
- ↑ Elke Warmuth, Walter Warmuth: Elementare Wahrscheinlichkeitsrechnung: Vom Umgang mit dem Zufall. Vieweg + Teubner 1998, ISBN 9783519002253, S. 128–129
- ↑ Sammelbilderproblem systematisch lösen mithilfe der Schulmathematik (PDF; 358 kB)
- ↑ Andreas Binzenhöfer, Tobias Hoßfeld: Warum Panini Fußballalben auch Informatikern Spaß machen, in: Hans-Georg Weigand (Hrsg.): Fußball – eine Wissenschaft für sich, Königshausen&Neumann, Würzburg, 2006, S. 181–191
- ↑ Wolfgang Stadje: The Collector's Problem with Group Drawings, Advances in Applied Probability, Vol. 22, No. 4 (Dec., 1990), pp. 866-882
- ↑ a b c Niklas Braband, Sonja Braband und Malte Braband: Neue Ergebnisse für das Sammelbilderproblem mit Tauschen und Nachkaufen, Gymnasium Neue Oberschule, Braunschweig, und Technische Universität Braunschweig, 2016
- ↑ a b Philippe Flajolet, Danièle Gardy, Loÿs Thimonier Birthday paradox, coupon collectors, caching algorithms and self-organizing search. (GZIP; 77 kB), Discrete Applied Mathematics, Vol. 39, (1992), S. 207–229
- ↑ Holger Dambeck: Mathematiker rechnen wie man das Panini-Album schneller und billiger füllt auf Spiegel Online am 30. Mai 2012.
- ↑ a b c Sylvain Sardy und Yvan Velenik: Paninimania: sticker rarity and cost-effective strategy, Swiss Statistical Society, Bulletin nr. 66 (2010), 2-6.
- ↑ Doron Zeilberger: How Many Singles, Doubles, Triples, Etc., Should The Coupon Collector Expect?.
- ↑ Panini-WM-Sticker: Millionen-Stichprobe zeigt massive Ungleichverteilung, Spiegel online, 19. Juni 2014. Abgerufen 19. Juni 2014.
- ↑ Niklas Braband, Sonja Braband und Malte Braband: Zur Gültigkeit der Annahmen des klassischen Sammelbilderproblems, Gymnasium Neue Oberschule, Braunschweig, und Technische Universität Braunschweig, 2016
- ↑ Elke Warmuth, Stefan Lange: Mathematik Anders Machen - Eine Initiative zur Lehrerfortbildung, abgerufen am 30. April 2016
- ↑ Holger Dambeck: WM-Album. So teuer kommt der Sammelbildwahn auf Spiegel Online am 30. Juni 2011
- ↑ Wales Online: A maths genius worked out exactly how much it will cost to fill your Panini Euro 2016 album, abgerufen am 4. Mai 2016
- ↑ Cross Validated: Expectation of collecting stickers in groups, abgerufen am 4. Mai 2016
- ↑ Das Einmaleins der Panini Sticker. In: dw.com. Deutsche Welle, 12. Mai 2016, abgerufen am 14. Mai 2016.