Los siguientes ejercicios deben ser realizados en dos formas, primero de manera manual y posteriormente por medio de software. Al ser realizados a mano, deben ser hechos con limpieza y orden, para posteriormente ser digitalizados por el método que tengan a su alcance. Al ser realizados por medio de software se recomienda el uso de RSTudio para la resolución de los problemas y la generación del documento a entregar. La combinación de ambos documentos debe ser enviada en una carpeta comprimida a la plataforma habilitada para tal uso. No se admiten evidencias en físico.

Tablas de frecuencia

Enseguida se presentan algunas tablas. Las columnas son arbitrarias y no implican variables diferentes ni nada por el estilo, es decir, los datos se dividieron en columnas solo para una mejor presentación en pantalla. En realidad se refieren a una sola columna.

  1. Los cinco automóviles más vendidos en Estados Unidos durante 2003 fueron la camioneta Chevrolet Silverado/C/K, la camioneta Dodge Ram, la camioneta Ford F-Series, el Honda Accord y el Toyota Camry (Motor Trend, 2003). En la siguiente tabla se presenta una muestra de 50 compras de automóviles.
##           V1
## 1  Silverado
## 2        Ram
## 3     Accord
## 4      Camry
## 5      Camry
## 6  Silverado
## 7  Silverado
## 8      Camry
## 9        Ram
## 10  F-Series
## 11       Ram
## 12  F-Series
## 13    Accord
## 14       Ram
## 15       Ram
## 16 Silverado
## 17  F-Series
## 18  F-Series
## 19 Silverado
## 20       Ram
## 21       Ram
## 22       Ram
## 23    Accord
## 24 Silverado
## 25     Camry
## 26  F-Series
## 27       Ram
## 28 Silverado
## 29    Accord
## 30 Silverado
## 31     Camry
## 32  F-Series
## 33  F-Series
## 34  F-Series
## 35 Silverado
## 36  F-Series
## 37 Silverado
## 38  F-Series
## 39  F-Series
## 40       Ram
## 41 Silverado
## 42 Silverado
## 43     Camry
## 44     Camry
## 45  F-Series
## 46 Silverado
## 47  F-Series
## 48  F-Series
## 49    Accord
## 50    Accord
  1. Elabore una distribución de frecuencia y otra de frecuencia porcentual (relativa).
  2. ¿Cuál es la camioneta y el automóvil de pasajeros más vendidos?
  3. Haga una gráfica de pastel.
  1. El Higher Education Research Institute de UCLA cuenta con estadísticas sobre las áreas que son más elegidas por los estudiantes de nuevo ingreso. Las cinco más elegidas son arte y humanidades (A), administración de negocios (B), ingeniería (E), política (P) y ciencias sociales (S) (The New York Times Almanac, 2006). Otras áreas (O), entre las que se encuentran biología, física, ciencias de la computación y educación se agruparon todas en una sola categoría. Las siguientes fueron las áreas elegidas por 64 estudiantes de recién ingreso de una muestra.
##    V1
## 1   S
## 2   P
## 3   P
## 4   O
## 5   B
## 6   E
## 7   O
## 8   E
## 9   P
## 10  O
## 11  O
## 12  B
## 13  O
## 14  O
## 15  O
## 16  A
## 17  O
## 18  E
## 19  E
## 20  B
## 21  S
## 22  O
## 23  B
## 24  O
## 25  A
## 26  O
## 27  E
## 28  O
## 29  E
## 30  O
## 31  B
## 32  P
## 33  B
## 34  A
## 35  S
## 36  O
## 37  E
## 38  A
## 39  B
## 40  O
## 41  S
## 42  S
## 43  O
## 44  O
## 45  E
## 46  B
## 47  O
## 48  B
## 49  A
## 50  E
## 51  B
## 52  E
## 53  A
## 54  A
## 55  P
## 56  O
## 57  O
## 58  E
## 59  O
## 60  B
## 61  B
## 62  O
## 63  P
## 64  B
  1. Dé una distribución de frecuencia y otra de frecuencia porcentual.
  2. Elabore una gráfica de barras.
  3. ¿Que porcentaje de los estudiantes de nuevo ingreso elige una de las cinco áreas más elegidas?
  4. ¿Cuál es el área más elegida por los estudiantes de nuevo ingreso? ¿Qué porcentaje de los estudiantes de nuevo ingreso elige esta área?

Distribuciones de frecuencia

  1. Cada año en Estados Unidos, aproximadamente 1.5 millones de los estudiantes de educación superior presentan un examen de aptitud escolar (SAT, por sus siglas en inglés). Cerca de 80% de las universidades e instituciones de educación superior emplean las puntuaciones obtenidas por los estudiantes en este examen como criterio de admisión (College Board, marzo de 2006). A continuación se presentan las puntuaciones obtenidas en las áreas de matemáticas y expresión verbal por una muestra de estudiantes.
##      V1
## 1  1025
## 2  1042
## 3  1195
## 4   880
## 5   945
## 6  1102
## 7   845
## 8  1095
## 9   936
## 10  790
## 11 1097
## 12  913
## 13 1245
## 14 1040
## 15  998
## 16  998
## 17  940
## 18 1043
## 19 1048
## 20 1130
## 21 1017
## 22 1140
## 23 1030
## 24 1171
## 25 1035
  1. Presente una distribución de frecuencia y un histograma de estas puntuaciones.
  2. Elabore otra distribución e histograma con la primera clase comenzando en la puntuación 750 y la amplitud de clase deberá ser 100.
  3. Dé un comentario sobre la forma de la distribución.
  4. ¿Qué otras observaciones puede hacer acerca de estas puntuaciones con base en los resúmenes tabulares y gráficos?

Diagrama de tallo y hojas

  1. Drug Store News (septiembre de 2002) proporciona datos sobre ventas de medicamentos de las principales farmacias de Estados Unidos. Los datos siguientes son ventas anuales en millones.
##          Farmacia Ventas
## 1       Ahold-USA   1700
## 2             CVS  12700
## 3          Eckerd   7739
## 4           Kmart   1863
## 5          Kroger   3400
## 6  MedicineShoppe   1757
## 7        Rite-Aid   8637
## 8         Safeway   2150
## 9       Walgreens  11660
## 10       Wal-Mart   7250
  1. Elabore un diagrama de tallo y hojas.
  2. Indique cuáles son las ventas anuales menores, mayores e intermedias.
  3. ¿Cuáles son las dos farmacias mayores?
  1. A continuación se presentan las temperaturas diarias más altas y más bajas registradas en 20 ciudades de Estados Unidos (USA Today, 3 de marzo 2006).
##          Ciudad Alta Baja
## 1   Albuquerque   66   39
## 2       Atlanta   61   35
## 3     Baltimore   42   26
## 4     Charlotte   60   29
## 5    Cincinnati   41   21
## 6        Dallas   62   47
## 7        Denver   60   31
## 8       Houston   70   54
## 9  Indianapolis   42   22
## 10     LasVegas   65   43
## 11   LosAngeles   60   46
## 12        Miami   84   65
## 13  Minneapolis   30   11
## 14   NewOrleans   68   50
## 15 OklahomaCity   62   40
## 16      Phoenix   77   50
## 17     Portland   54   38
## 18     St.Louis   45   27
## 19 SanFrancisco   55   43
## 20      Seattle   52   36
  1. Con las temperaturas altas elabore un diagrama de tallo y hojas.
  2. Con las temperaturas bajas elabore un diagrama de tallo y hojas.
  3. Compare los dos diagramas y haga comentarios acerca de las diferencias entre las tempera turas más altas y las más bajas.
  4. Proporcione una distribución de frecuencia de las temperaturas más altas y de las más bajas.
  1. De acuerdo con 2003 Annual Consumer Spending Survey, el cargo promedio mensual a una tarjeta de crédito Bank of America Visa fue de $1,838 (U.S. Airways Attaché Magazine, diciembre de 2003). En una muestra de cargos mensuales a tarjetas de crédito los datos obtenidos son los siguientes.
##      V1
## 1   236
## 2  1710
## 3  1351
## 4   825
## 5  7450
## 6   316
## 7  4135
## 8  1333
## 9  1584
## 10  387
## 11  991
## 12 3396
## 13  170
## 14 1428
## 15 1688
  1. Calcule la media y la mediana.
  2. Calcule el primero y tercer cuartil.
  3. Calcule el rango y el rango intercuartílico.
  4. Calcule la varianza y la desviación estándar.
  5. Comente la forma de la distribución. ¿Esta es la forma que esperaría? ¿Por qué sí o por qué no?
  6. ¿Hay observaciones atípicas en estos datos?
  7. Trace el gráfico de caja pertinente.
  1. La oficina de censos de Estados Unidos proporciona estadísticas sobre las familias en ese país, informaciones como edad al contraer el primer matrimonio, estado civil actual y tamaño de la casa (www.census.gov, 20 de marzo de 2006). Los datos siguientes son edades al contraer el primer matrimonio en una muestra de hombres y en una muestra de mujeres.
##         V1      V2
## 1  HOMBRES MUJERES
## 2       26      20
## 3       23      28
## 4       28      23
## 5       25      30
## 6       27      24
## 7       30      29
## 8       26      26
## 9       35      25
## 10      28      22
## 11      21      22
## 12      24      25
## 13      27      23
## 14      29      27
## 15      30      26
## 16      27      19
## 17      32    <NA>
## 18      27    <NA>
## 19      25    <NA>
  1. Determine la mediana en la edad de hombres y mujeres al contraer el primer matrimonio.
  2. Calcule el primer y tercer cuartil tanto en los hombres como en las mujeres.
  3. Hace 30 años la mediana en la edad al contraer el primer matrimonio era 25 años entre los hombres y 22 años entre las mujeres. ¿Qué indica esta información acerca de la edad a la que deciden contraer matrimonio los jóvenes de hoy en día?
  4. Trace la gráfica de caja para este problema.

Análisis de regresión

Vuelva al conjunto de datos del problema 5.

  1. Elabore un diagrama de dispersión que muestre la relación entre las dos variables, tempera tura más alta y temperatura más baja.