eliminate break in right side of "p"
[wiki.git] / r.mdwn
1 https://r-graphics.org
2
3 Inspired by https://canvas.harvard.edu/courses/5749/assignments/syllabus (STAT E-100, Fall 2015)
4
5     > options(warn=-1) # warnings from `library` are annoying
6     > options(device="png") # instead of Rplots.pdf
7     > out <- capture.output(suppressMessages(library("mosaic")))
8     > # conduct analyses of Titanic data
9     > # frequency table of counts with marginal totals
10     > tally(~Survived, format = "count", data = Titanic, margins = TRUE)
11
12        No   Yes Total 
13       618   427  1045 
14     > # bar graph of survival
15     > bargraph(~Survived, data = Titanic)
16
17 <img src="titanic/Rplot001.png">
18
19     > # frequency table of propotions with marginal totals
20     > tally(~Survived, format = "proportion", data = Titanic, margins = TRUE)
21
22        No   Yes Total 
23      0.59  0.41  1.00 
24     > # frequency table of percentages with marginal totals
25     > tally(~Survived, format = "percent", data = Titanic, margins = TRUE)
26
27        No   Yes Total 
28        59    41   100 
29     > # pie chart of survival
30     > pie(tally(~Survived, format = "count", data = Titanic))
31
32 <img src="titanic/Rplot002.png">
33
34     > # contingency table of counts
35     > tally(~Class + Survived, format = "count", margins=TRUE, data = Titanic)
36             Survived
37     Class      No  Yes Total
38       Lower   369  131   500
39       Middle  146  115   261
40       Upper   103  181   284
41       Total   618  427  1045
42     > # contingency table of proportions without conditioning
43     > tally(~Class + Survived, format = "proportion", margins=TRUE, data = Titanic)
44             Survived
45     Class       No   Yes Total
46       Lower  0.353 0.125 0.478
47       Middle 0.140 0.110 0.250
48       Upper  0.099 0.173 0.272
49       Total  0.591 0.409 1.000
50     > # contingency table of percentages without conditioning,
51     > tally(~Class + Survived, format = "percent", margins=TRUE, data = Titanic)
52             Survived
53     Class       No   Yes Total
54       Lower   35.3  12.5  47.8
55       Middle  14.0  11.0  25.0
56       Upper    9.9  17.3  27.2
57       Total   59.1  40.9 100.0
58     > # conditioning on survival
59     > # Of those who survived, what percentage were in the lower class? (31%)
60     > tally(~Class | Survived, format = "percent", data = Titanic, margins=TRUE)
61             Survived
62     Class     No Yes
63       Lower   60  31
64       Middle  24  27
65       Upper   17  42
66       Total  100 100
67     > # conditioning on passenger class
68     > # Of those in the lower class, what percent survived? (26%)
69     > tally(~Survived | Class, format = "percent", data = Titanic, margins=TRUE)
70             Class
71     Survived Lower Middle Upper
72        No       74     56    36
73        Yes      26     44    64
74        Total   100    100   100
75     > # Dodged Bar Graph: Survival with Class Subgroups
76     > bargraph(~Survived, groups=Class, auto.key=TRUE, data=Titanic)
77
78 <img src="titanic/Rplot003.png">
79
80     > # Dodged Bar Graph: Class with Survival Subgroups
81     > bargraph(~Class, groups=Survived, auto.key=TRUE, data=Titanic)
82
83 <img src="titanic/Rplot004.png">
84
85     > # Stacked Bar Graph: Survival with Class Subgroups
86     > bargraph(~Survived, groups=Class, auto.key=TRUE, stack=TRUE, data=Titanic)
87
88 <img src="titanic/Rplot005.png">
89
90     > # Stacked Bar Graph: Class with Survival Subgroups
91     > bargraph(~Class, groups=Survived, auto.key=TRUE, stack=TRUE, data=Titanic)
92
93 <img src="titanic/Rplot006.png">
94
95     > # Unconditional Distribution of Survival and Conditional Distributions of Class
96     > mosaicplot(~Survived + Class, color=TRUE, data=Titanic)
97
98 <img src="titanic/Rplot007.png">
99
100     > # Distributions of class conditional on survival
101     > tally(~Class | Survived, format = "percent", data = Titanic, margins=TRUE)
102             Survived
103     Class     No Yes
104       Lower   60  31
105       Middle  24  27
106       Upper   17  42
107       Total  100 100
108     > # Unconditional Distribution of Class and Conditional Distributions of Survival
109     > mosaicplot(~Class + Survived, color=TRUE, data=Titanic)
110
111 <img src="titanic/Rplot008.png">
112
113     > # Distributions of survival conditional on class
114     > tally(~Survived | Class, format = "percent", data = Titanic, margins=TRUE)
115             Class
116     Survived Lower Middle Upper
117        No       74     56    36
118        Yes      26     44    64
119        Total   100    100   100