ScalaでSparkのDataframe②

ScalaでSpark Dataframe。たまにメモリ解放しないと謎挙動示すので注意。 irisを使用 //CSVの読み込み。OptintionのInferSchema tureで型を自動認識する var df = spark.read.format("csv").option("header", "true").option("inferSchema", "true").load(f…

2018-03-29

ScalaでSparkのDataframe（一部Dataset）

scala spark

列の追加に癖がある。単純に列指定で追加するのが難しいようだ。 import org.apache.spark.sql.SparkSession //Dataset 化 val spark = SparkSession.builder().appName("Spark SQL basic example").config("spark.some.config.option", "some-value").mast…

2018-03-25

ScalaでSpark

scala Spark

ScalaでSpark。pythonの方が多いが気にしない適宜追加予定 //CSV読み込み scala> val df = spark.read .format("csv").option("header", "true").option("mode", "DROPMALFORMED").option("inferSchema","True").load("iris.csv") // 各列の型表示 scala> d…

2018-03-23

scala覚え書き

scala

位置参照（スライス）に関して追記 1. ListやArrayの操作基本 scala> val test_array = (0 to 10).toArray test_array: Array[Int] = Array(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10) //範囲抽出 scala> test_array.slice(3,7) res38: Array[Int] = Array(3, 4, 5,…

2018-01-20

tensorflowとcupyのwindows環境インストール（cuDNN、CUDA）（Linuxのみ2018/1/21時点の情報）

python

追記：WindowsはCUDA9.1未対応。Windowsは下記参照 tatabox.hatenablog.com cuDNN7でpython3.6とCUDA9.1に対応。インストールが簡単になった。 1. CUDAを下記から落としてインストール CUDA （現時点では9.1が最新） https://developer.nvidia.com/cuda-down…

tata色々な備忘録

データ解析、画像解析、化学分析などなど

2018-01-01から1年間の記事一覧

ScalaでSparkのDataframe②

ScalaでSparkのDataframe（一部Dataset）

ScalaでSpark

scala覚え書き

tensorflowとcupyのwindows環境インストール（cuDNN、CUDA）（Linuxのみ2018/1/21時点の情報）