SHOW:
|
|
- or go back to the newest paste.
| 1 | - | --Загрузите датафрейм из файла /datasets/pickups_terminal_5.csv. Посмотрите в документации, как работает функция show(). Напечайте на экране пять строк из датафрейма. |
| 1 | + | --Методом show() размер датасета не получить. Найдите в документации функцию, которая посчитает количество строк. Напечайте результат на экране. |
| 2 | ||
| 3 | import numpy as np | |
| 4 | import pandas as pd | |
| 5 | from pyspark.sql import SparkSession | |
| 6 | ||
| 7 | APP_NAME = "DataFrames" | |
| 8 | SPARK_URL = "local[*]" | |
| 9 | ||
| 10 | spark = SparkSession.builder.appName(APP_NAME) \ | |
| 11 | .config('spark.ui.showConsoleProgress', 'false') \
| |
| 12 | .getOrCreate() | |
| 13 | ||
| 14 | - | taxi = spark.read.load('/datasets/pickups_terminal_5.csv', format='csv', header='true', inferSchema='true')
|
| 14 | + | taxi = spark.read.load('/datasets/pickups_terminal_5.csv',
|
| 15 | format='csv', header='true', inferSchema='true') | |
| 16 | - | print(taxi.show(5)) |
| 16 | + | |
| 17 | print(taxi.count()) |