亚洲国产成人久久77,四虎影視久久久免費觀看

現(xiàn)在我們已經(jīng)介紹了一些用于構建和訓練深度網(wǎng)絡并使用包括權重衰減和丟失在內(nèi)的技術對其進行正則化的基本工具，我們準備通過參加 Kaggle 競賽將所有這些知識付諸實踐。房價預測競賽是一個很好的起點。數(shù)據(jù)相當通用，沒有表現(xiàn)出可能需要專門模型（如音頻或視頻可能）的奇異結構。該數(shù)據(jù)集由 De Cock ( 2011 )收集，涵蓋 2006 年至 2010 年愛荷華州埃姆斯的房價。它比Harrison 和 Rubinfeld (1978)著名的波士頓住房數(shù)據(jù)集大得多，擁有更多的例子和更多的特征。

在本節(jié)中，我們將帶您了解數(shù)據(jù)預處理、模型設計和超參數(shù)選擇的詳細信息。我們希望通過實踐方法，您將獲得一些直覺，這些直覺將指導您作為數(shù)據(jù)科學家的職業(yè)生涯。

%matplotlib inline
import pandas as pd
import torch
from torch import nn
from d2l import torch as d2l

%matplotlib inline
import pandas as pd
from mxnet import autograd, gluon, init, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

%matplotlib inline
import jax
import numpy as np
import pandas as pd
from jax import numpy as jnp
from d2l import jax as d2l

No GPU/TPU found, falling back to CPU. (Set TF_CPP_MIN_LOG_LEVEL=0 and rerun for more info.)

%matplotlib inline
import pandas as pd
import tensorflow as tf
from d2l import tensorflow as d2l

5.7.1. 下載數(shù)據(jù)

在整本書中，我們將在各種下載的數(shù)據(jù)集上訓練和測試模型。在這里，我們實現(xiàn)了兩個實用函數(shù)來下載文件和提取 zip 或 tar 文件。同樣，我們將它們的實現(xiàn)推遲到第 23.7 節(jié)。

def download(url, folder, sha1_hash=None):
  """Download a file to folder and return the local filepath."""

def extract(filename, folder):
  """Extract a zip/tar file into folder."""

5.7.2. 格格

Kaggle是一個舉辦機器學習競賽的流行平臺。每場比賽都以數(shù)據(jù)集為中心，許多比賽由利益相關者贊助，他們?yōu)楂@勝的解決方案提供獎勵。該平臺幫助用戶通過論壇和共享代碼進行交互，促進協(xié)作和競爭。雖然排行榜追逐經(jīng)常失控，研究人員短視地關注預處理步驟而不是提出基本問題，但平臺的客觀性也具有巨大價值，該平臺有助于競爭方法之間的直接定量比較以及代碼共享，以便每個人都可以了解哪些有效，哪些無效。如果你想?yún)⒓?Kaggle 比賽，你首先需要注冊一個賬號（見圖 5.7.1）。

圖 5.7.1 Kaggle 網(wǎng)站。

在房價預測比賽頁面，如圖 5.7.2所示，可以找到數(shù)據(jù)集（在“數(shù)據(jù)”選項卡下），提交預測，就可以看到你的排名，網(wǎng)址在這里：

https://www.kaggle.com/c/house-prices-advanced-regression-techniques

圖 5.7.2房價預測比賽頁面。

5.7.3. 訪問和讀取數(shù)據(jù)集

請注意，比賽數(shù)據(jù)分為訓練集和測試集。每條記錄包括房屋的屬性值和街道類型、建造年份、屋頂類型、地下室狀況等屬性。特征由各種數(shù)據(jù)類型組成。例如，建造年份用整數(shù)表示，屋頂類型用離散的分類分配表示，其他特征用浮點數(shù)表示。這就是現(xiàn)實使事情復雜化的地方：例如，一些數(shù)據(jù)完全缺失，缺失值簡單地標記為“na”。每個房子的價格僅包含在訓練集中（畢竟這是一場比賽）。我們希望對訓練集進行分區(qū)以創(chuàng)建驗證集，但我們只能在將預測上傳到 Kaggle 后才能在官方測試集上評估我們的模型。圖 5.7.2有下載數(shù)據(jù)的鏈接。

首先，我們將pandas使用我們在第 2.2 節(jié)中介紹的方法讀入和處理數(shù)據(jù)。為了方便起見，我們可以下載并緩存 Kaggle 住房數(shù)據(jù)集。如果與此數(shù)據(jù)集對應的文件已存在于緩存目錄中并且其 SHA-1 匹配sha1_hash，我們的代碼將使用緩存文件以避免因冗余下載而阻塞您的互聯(lián)網(wǎng)。

class KaggleHouse(d2l.DataModule):
  def __init__(self, batch_size, train=None, val=None):
    super().__init__()
    self.save_hyperparameters()
    if self.train is None:
      self.raw_train = pd.read_csv(d2l.download(
        d2l.DATA_URL + 'kaggle_house_pred_train.csv', self.root,
        sha1_hash='585e9cc93e70b39160e7921475f9bcd7d31219ce'))
      self.raw_val = pd.read_csv(d2l.download(
        d2l.DATA_URL + 'kaggle_house_pred_test.csv', self.root,
        sha1_hash='fa19780a7b011d9b009e8bff8e99922a8ee2eb90'))

訓練數(shù)據(jù)集包含 1460 個示例、80 個特征和 1 個標簽，而驗證數(shù)據(jù)包含 1459 個示例和 80 個特征。

data = KaggleHouse(batch_size=64)
print(data.raw_train.shape)
print(data.raw_val.shape)

Downloading ../data/kaggle_house_pred_train.csv from http://d2l-data.s3-accelerate.amazonaws.com/kaggle_house_pred_train.csv...
Downloading ../data/kaggle_house_pred_test.csv from http://d2l-data.s3-accelerate.amazonaws.com/kaggle_house_pred_test.csv...
(1460, 81)
(1459, 80)

data = KaggleHouse(batch_size=64)
print(data.raw_train.shape)
print(data.raw_val.shape)

Downloading ../data/kaggle_house_pred_train.csv from http://d2l-data.s3-accelerate.amazonaws.com/kaggle_house_pred_train.csv...
Downloading ../data/kaggle_house_pred_test.csv from http://d2l-data.s3-accelerate.amazonaws.com/kaggle_house_pred_test.csv...
(1460, 81)
(1459, 80)

data = KaggleHouse(batch_size=64)
print(data.raw_train.shape)
print(data.raw_val.shape)

Downloading ../data/kaggle_house_pred_train.csv from http://d2l-data.s3-accelerate.amazonaws.com/kaggle_house_pred_train.csv...
Downloading ../data/kaggle_house_pred_test.csv from http://d2l-data.s3-accelerate.amazonaws.com/kaggle_house_pred_test.csv...
(1460, 81)
(1459, 80)

data = KaggleHouse(batch_size=64)
print(data.raw_train.shape)
print(data.raw_val.shape)

Downloading ../data/kaggle_house_pred_train.csv from http://d2l-data.s3-accelerate.amazonaws.com/kaggle_house_pred_train.csv...
Downloading ../data/kaggle_house_pred_test.csv from http://d2l-data.s3-accelerate.amazonaws.com/kaggle_house_pred_test.csv...
(1460, 81)
(1459, 80)

5.7.4. 數(shù)據(jù)預處理

我們來看看前四個和最后兩個特征以及前四個示例中的標簽 (SalePrice)。

print(data.raw_train.iloc[:4, [0, 1, 2, 3, -3, -2, -1]])

  Id MSSubClass MSZoning LotFrontage SaleType SaleCondition SalePrice
0  1     60    RL     65.0    WD    Normal   208500
1  2     20    RL     80.0    WD    Normal   181500
2  3     60    RL     68.0    WD    Normal   223500
3  4     70    RL     60.0    WD    Abnorml   140000

print(data.raw_train.iloc[:4, [0, 1, 2, 3, -3, -2, -1]])

  Id MSSubClass MSZoning LotFrontage SaleType SaleCondition SalePrice
0  1     60    RL     65.0    WD    Normal   208500
1  2     20    RL     80.0    WD    Normal   181500
2  3     60    RL     68.0    WD    Normal   223500
3  4     70    RL     60.0    WD    Abnorml   140000

print(data.raw_train.iloc[:4, [0, 1, 2, 3, -3, -2, -1]])

  Id MSSubClass MSZoning LotFrontage SaleType SaleCondition SalePrice
0  1     60    RL     65.0    WD    Normal   208500
1  2     20    RL     80.0    WD    Normal   181500
2  3     60    RL     68.0    WD    Normal   223500
3  4     70    RL     60.0    WD    Abnorml   140000

print(data.raw_train.iloc[:4, [0, 1, 2, 3, -3, -2, -1]])

  Id MSSubClass MSZoning LotFrontage SaleType SaleCondition SalePrice
0  1     60    RL     65.0    WD    Normal   208500
1  2     20    RL     80.0    WD    Normal   181500
2  3     60    RL     68.0    WD    Normal   223500
3  4     70    RL     60.0    WD    Abnorml   140000

我們可以看到，在每個示例中，第一個特征是 ID。這有助于模型識別每個訓練示例。雖然這很方便，但它不攜帶任何用于預測目的的信息。因此，我們將在將數(shù)據(jù)輸入模型之前將其從數(shù)據(jù)集中刪除。此外，鑒于數(shù)據(jù)類型多種多樣，我們需要在開始建模之前對數(shù)據(jù)進行預處理。

讓我們從數(shù)字特征開始。首先，我們應用啟發(fā)式方法，用相應特征的平均值替換所有缺失值。然后，為了將所有特征放在一個共同的尺度上，我們通過將特征重新縮放為零均值和單位方差來標準化數(shù)據(jù)：

(5.7.1)x←x?μσ,

在哪里μ和σ分別表示平均值和標準偏差。為了驗證這確實改變了我們的特征（變量），使其具有零均值和單位方差，請注意 E[x?μσ]=μ?μσ=0然后 E[(x?μ)2]=(σ2+μ2)?2μ2+μ2=σ2. 直覺上，我們標準化數(shù)據(jù)有兩個原因。首先，證明它便于優(yōu)化。其次，因為我們先驗地不知道哪些特征是相關的，所以我們不想懲罰分配給一個特征的系數(shù)比其他任何特征更多。

接下來我們處理離散值。這包括諸如“MSZoning”之類的功能。我們將它們替換為 one-hot 編碼，其方式與我們之前將多類標簽轉(zhuǎn)換為向量的方式相同（請參閱第 4.1.1 節(jié)）。例如，“MSZoning”采用值“RL”和“RM”。刪除“MSZoning”特征，創(chuàng)建兩個新的指標特征“MSZoning_RL”和“MSZoning_RM”，其值為0或1。根據(jù)one-hot編碼，如果“MSZoning”的原始值為“RL”，則“ MSZoning_RL” 為 1，“MSZoning_RM” 為 0。pandas包會自動為我們完成此操作。

@d2l.add_to_class(KaggleHouse)
def preprocess(self):
  # Remove the ID and label columns
  label = 'SalePrice'
  features = pd.concat(
    (self.raw_train.drop(columns=['Id', label]),
     self.raw_val.drop(columns=['Id'])))
  # Standardize numerical columns
  numeric_features = features.dtypes[features.dtypes!='object'].index
  features[numeric_features] = features[numeric_features].apply(
    lambda x: (x - x.mean()) / (x.std()))
  # Replace NAN numerical features by 0
  features[numeric_features] = features[numeric_features].fillna(0)
  # Replace discrete features by one-hot encoding
  features = pd.get_dummies(features, dummy_na=True)
  # Save preprocessed features
  self.train = features[:self.raw_train.shape[0]].copy()
  self.train[label] = self.raw_train[label]
  self.val = features[self.raw_train.shape[0]:].copy()

您可以看到此轉(zhuǎn)換將特征數(shù)量從 79 增加到 331（不包括 ID 和標簽列）。

data.preprocess()
data.train.shape

(1460, 332)

data.preprocess()
data.train.shape

(1460, 332)

data.preprocess()
data.train.shape

(1460, 332)

data.preprocess()
data.train.shape

(1460, 332)

5.7.5. 誤差測量

首先，我們將訓練一個具有平方損失的線性模型。毫不奇怪，我們的線性模型不會導致提交競賽獲勝，但它提供了完整性檢查以查看數(shù)據(jù)中是否存在有意義的信息。如果我們在這里不能比隨機猜測做得更好，那么我們很可能遇到數(shù)據(jù)處理錯誤。如果一切正常，線性模型將作為基線，讓我們直觀地了解簡單模型與最佳報告模型的接近程度，讓我們了解我們應該從更高級的模型中獲得多少收益。

對于房價，就像股票價格一樣，我們更關心相對數(shù)量而不是絕對數(shù)量。因此我們更傾向于關心相對誤差y?y^y比關于絕對誤差y?y^. 例如，如果我們在估計俄亥俄州農(nóng)村地區(qū)的房屋價格時預測偏離 100,000 美元，那里典型房屋的價值為 125,000 美元，那么我們可能做得很糟糕。另一方面，如果我們在加利福尼亞州的 Los Altos Hills 出現(xiàn)這個數(shù)額的錯誤，這可能代表了一個驚人準確的預測（那里的房價中位數(shù)超過 400 萬美元）。

解決這個問題的一種方法是衡量價格估計的對數(shù)差異。事實上，這也是比賽用來評估提交質(zhì)量的官方誤差衡量標準。畢竟價值不高δ為了 |log?y?log?y^|≤δ翻譯成 e?δ≤y^y≤eδ. 這導致預測價格的對數(shù)與標簽價格的對數(shù)之間存在以下均方根誤差：

(5.7.2)1n∑i=1n(log?yi?log?y^i)2.

@d2l.add_to_class(KaggleHouse)
def get_dataloader(self, train):
  label = 'SalePrice'
  data = self.train if train else self.val
  if label not in data: return
  get_tensor = lambda x: torch.tensor(x.values, dtype=torch.float32)
  # Logarithm of prices
  tensors = (get_tensor(data.drop(columns=[label])), # X
        torch.log(get_tensor(data[label])).reshape((-1, 1))) # Y
  return self.get_tensorloader(tensors, train)

@d2l.add_to_class(KaggleHouse)
def get_dataloader(self, train):
  label = 'SalePrice'
  data = self.train if train else self.val
  if label not in data: return
  get_tensor = lambda x: np.array(x.values, dtype=np.float32)
  # Logarithm of prices
  tensors = (get_tensor(data.drop(columns=[label])), # X
        np.log(get_tensor(data[label])).reshape((-1, 1))) # Y
  return self.get_tensorloader(tensors, train)

@d2l.add_to_class(KaggleHouse)
def get_dataloader(self, train):
  label = 'SalePrice'
  data = self.train if train else self.val
  if label not in data: return
  get_tensor = lambda x: jnp.array(x.values, dtype=jnp.float32)
  # Logarithm of prices
  tensors = (get_tensor(data.drop(columns=[label])), # X
        jnp.log(get_tensor(data[label])).reshape((-1, 1))) # Y
  return self.get_tensorloader(tensors, train)

@d2l.add_to_class(KaggleHouse)
def get_dataloader(self, train):
  label = 'SalePrice'
  data = self.train if train else self.val
  if label not in data: return
  get_tensor = lambda x: tf.constant(x.values, dtype=tf.float32)
  # Logarithm of prices
  tensors = (get_tensor(data.drop(columns=[label])), # X
        tf.reshape(tf.math.log(get_tensor(data[label])), (-1, 1))) # Y
  return self.get_tensorloader(tensors, train)

5.7.6.K-折疊交叉驗證

您可能還記得我們在第 3.6.3 節(jié)中介紹了交叉驗證，我們在那里討論了如何處理模型選擇。我們將充分利用它來選擇模型設計和調(diào)整超參數(shù)。我們首先需要一個返回ith將數(shù)據(jù)折疊成 K-折疊交叉驗證程序。它通過切出ith段作為驗證數(shù)據(jù)并將其余部分作為訓練數(shù)據(jù)返回。請注意，這不是處理數(shù)據(jù)的最有效方式，如果我們的數(shù)據(jù)集相當大，我們肯定會做一些更聰明的事情。但是這種增加的復雜性可能會不必要地混淆我們的代碼，因此由于問題的簡單性，我們可以在這里安全地省略它。

def k_fold_data(data, k):
  rets = []
  fold_size = data.train.shape[0] // k
  for j in range(k):
    idx = range(j * fold_size, (j+1) * fold_size)
    rets.append(KaggleHouse(data.batch_size, data.train.drop(index=idx),
                data.train.loc[idx]))
  return rets

我們訓練時返回平均驗證錯誤K時間在K- 折疊交叉驗證。

def k_fold(trainer, data, k, lr):
  val_loss, models = [], []
  for i, data_fold in enumerate(k_fold_data(data, k)):
    model = d2l.LinearRegression(lr)
    model.board.yscale='log'
    if i != 0: model.board.display = False
    trainer.fit(model, data_fold)
    val_loss.append(float(model.board.data['val_loss'][-1].y))
    models.append(model)
  print(f'average validation log mse = {sum(val_loss)/len(val_loss)}')
  return models

5.7.7. 選型

在這個例子中，我們選擇了一組未調(diào)整的超參數(shù)，并留給讀者來改進模型。找到一個好的選擇可能需要時間，具體取決于優(yōu)化了多少變量。有了足夠大的數(shù)據(jù)集和正常的超參數(shù)，K-折疊交叉驗證往往對多重測試具有合理的彈性。然而，如果我們嘗試了不合理的大量選項，我們可能會幸運地發(fā)現(xiàn)我們的驗證性能不再代表真正的錯誤。

trainer = d2l.Trainer(max_epochs=10)
models = k_fold(trainer, data, k=5, lr=0.01)

average validation log mse = 0.17563143908977508

trainer = d2l.Trainer(max_epochs=10)
models = k_fold(trainer, data, k=5, lr=0.01)

average validation log mse = 0.1256050333380699

trainer = d2l.Trainer(max_epochs=10)
models = k_fold(trainer, data, k=5, lr=0.01)

average validation log mse = 0.1252850264310837

trainer = d2l.Trainer(max_epochs=10)
models = k_fold(trainer, data, k=5, lr=0.01)

average validation log mse = 0.17464343845844268

請注意，有時一組超參數(shù)的訓練錯誤數(shù)量可能非常低，即使 K-折疊交叉驗證要高得多。這表明我們過度擬合。在整個培訓過程中，您需要監(jiān)控這兩個數(shù)字。較少的過度擬合可能表明我們的數(shù)據(jù)可以支持更強大的模型。大規(guī)模過度擬合可能表明我們可以通過結合正則化技術來獲益。

5.7.8. 在 Kaggle 上提交預測

現(xiàn)在我們知道應該選擇什么樣的超參數(shù)，我們可以計算所有超參數(shù)對測試集的平均預測 K楷模。將預測保存在 csv 文件中將簡化將結果上傳到 Kaggle 的過程。以下代碼將生成一個名為submission.csv.

preds = [model(torch.tensor(data.val.values, dtype=torch.float32))
     for model in models]
# Taking exponentiation of predictions in the logarithm scale
ensemble_preds = torch.exp(torch.cat(preds, 1)).mean(1)
submission = pd.DataFrame({'Id':data.raw_val.Id,
              'SalePrice':ensemble_preds.detach().numpy()})
submission.to_csv('submission.csv', index=False)

preds = [model(np.array(data.val.values, dtype=np.float32))
     for model in models]
# Taking exponentiation of predictions in the logarithm scale
ensemble_preds = np.exp(np.concatenate(preds, 1)).mean(1)
submission = pd.DataFrame({'Id':data.raw_val.Id,
              'SalePrice':ensemble_preds.asnumpy()})
submission.to_csv('submission.csv', index=False)

preds = [model.apply({'params': trainer.state.params},
     jnp.array(data.val.values, dtype=jnp.float32))
     for model in models]
# Taking exponentiation of predictions in the logarithm scale
ensemble_preds = jnp.exp(jnp.concatenate(preds, 1)).mean(1)
submission = pd.DataFrame({'Id':data.raw_val.Id,
              'SalePrice':np.asarray(ensemble_preds)})
submission.to_csv('submission.csv', index=False)

preds = [model(tf.constant(data.val.values, dtype=tf.float32))
     for model in models]
# Taking exponentiation of predictions in the logarithm scale
ensemble_preds = tf.reduce_mean(tf.exp(tf.concat(preds, 1)), 1)
submission = pd.DataFrame({'Id':data.raw_val.Id,
              'SalePrice':ensemble_preds.numpy()})
submission.to_csv('submission.csv', index=False)

接下來，如圖5.7.3所示，我們可以在 Kaggle 上提交我們的預測，并查看它們?nèi)绾闻c測試集上的實際房價（標簽）進行比較。步驟很簡單：

登錄Kaggle網(wǎng)站，訪問房價預測比賽頁面。

單擊“提交預測”或“延遲提交”按鈕（截至撰寫本文時，該按鈕位于右側）。

單擊頁面底部虛線框中的“上傳提交文件”按鈕，然后選擇您要上傳的預測文件。

單擊頁面底部的“提交”按鈕以查看結果。

圖 5.7.3向 Kaggle 提交數(shù)據(jù)

5.7.9. 概括

真實數(shù)據(jù)通常包含不同數(shù)據(jù)類型的混合，需要進行預處理。將實值數(shù)據(jù)重新調(diào)整為零均值和單位方差是一個很好的默認值。用平均值替換缺失值也是如此。此外，將分類特征轉(zhuǎn)換為指示特征允許我們將它們視為單熱向量。當我們更關心相對誤差而不是絕對誤差時，我們可以用預測的對數(shù)來衡量差異。要選擇模型并調(diào)整超參數(shù)，我們可以使用K折疊交叉驗證。

5.7.10。練習

將你對本節(jié)的預測提交給 Kaggle。你的預測有多好？

用平均值替換缺失值總是一個好主意嗎？提示：你能構造一個值不隨機缺失的情況嗎？

通過調(diào)整超參數(shù)來提高 Kaggle 的分數(shù) K- 折疊交叉驗證。

通過改進模型（例如，層數(shù)、權重衰減和丟失）來提高分數(shù)。

如果我們不像本節(jié)所做的那樣對連續(xù)數(shù)值特征進行標準化，會發(fā)生什么情況？

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

pytorch

pytorch

+關注

關注
2

文章
795

瀏覽量
13080

[原創(chuàng)]房價整體上漲推力到底是什么！

應當是意料之中的事。　　在2010年3月的十一屆全國人大三次會議上，國家各部委負責人在做民生答卷的過程中難免有些為難，其在下筆時孰輕孰重甚是難以拿捏，但都能把持有度，胸有成竹地著眼于繪制出漂亮的民生

發(fā)表于 03-16 13:57

15年，房價變向降了

一、房降價，因為亞運會結束后房價就會降低，專家說的。不過看看其他國家后，這個說法似乎不是很靠譜兒吧。二、借助亞運商機，狠狠賺一筆美金或歐元，亞運會期間會有很多外國人來到中國參加4年一度的盛會，估計

發(fā)表于 01-23 17:31

基于onepanel使用kaggle api提交結果和下載數(shù)據(jù)集的步驟

在onepanel上使用kaggle api提交結果和下載數(shù)據(jù)集

發(fā)表于 04-22 11:00

kaggle住宅價格預測

kaggle房價實戰(zhàn)總結

發(fā)表于 08-13 10:08

kaggle泰坦尼克生存預測實施步驟

數(shù)據(jù)分析-kaggle泰坦尼克號生存率分析（入門）個人總結

發(fā)表于 09-05 15:36

qiuzitao機器學習：桑坦德銀行客戶交易預測項目

數(shù)據(jù)挖掘?qū)崙?zhàn)–桑坦德銀行客戶交易預測項目一、項目介紹：這是2019年Kaggle的比賽：kaggle官網(wǎng)： https://www.kaggle.com/c

發(fā)表于 07-01 10:14

在Ubuntu 18.04 for Arm上運行的TensorFlow和PyTorch的Docker映像

TensorFlow和PyTorch是兩個最流行的機器學習框架。兩者在 Arm 上的使用都在增加，從像 Raspberry Pi 這樣的小型系統(tǒng)到用于服務器和高性能計算 (HPC) 的大型系統(tǒng)。盡管

發(fā)表于 10-14 14:25

通過Cortex來非常方便的部署PyTorch模型

，Hugging Face 生成的廣泛流行的自然語言處理(NLP)庫，是建立在 PyTorch 上的。Selene，生物前沿 ML 庫，建在 PyTorch

發(fā)表于 11-01 15:25

北京房價均降1萬！中國房價稱霸全球，北京房價均降一萬是皮毛！王健林的選擇是對是錯？

萬達宣布退出房地產(chǎn)驚呆了眾人，也許是王健林看出了房價市場的端倪。難道王健林真的是有先見之明，因為北京的房價目前均降一萬可是對于我們來說還是皮毛。據(jù)最新消息了解到中國的房價稱霸全球了，房價

發(fā)表于 09-07 20:20 ?4.4w次閱讀

如何很容易地將數(shù)據(jù)共享為Kaggle數(shù)據(jù)集

雖然一個更大的、機構層面的努力是理想的，但與此同時，我們也可以利用開源，免費使用Kaggle 這樣的資源。我認為 Kaggle 有可能做 Github 在早期科學重現(xiàn)性方面所做的事情。如果共享數(shù)據(jù)集既簡單又有趣，有潛在的回報，

發(fā)表于 06-29 15:06 ?5216次閱讀

這些年來，我們的數(shù)據(jù)科學究竟發(fā)生了什么變化？

那么logistic回歸受歡迎的原因是什么？一個跡象表明，Kaggle上的分類問題遠多于回歸問題，其中一個代表是這些年來最受歡迎的泰坦尼克號生存預測競賽。這是Kaggle

發(fā)表于 08-13 09:07 ?2710次閱讀

如何使用改進GM模型進行房價預測模型資料說明

本文將以青島西海岸新區(qū)商品房價格為例，針對商品房價格呈現(xiàn)動態(tài)變化的特點，利用改進的GM （1， 1）模型與馬爾可夫模型結合，提出一種基于時間序列的預測模型，對青島西海岸新區(qū)的商品房價格

發(fā)表于 12-19 11:44 ?7次下載

Kaggle神器LightGBM的最全解讀

模型具有訓練效果好、不易過擬合等優(yōu)點。GBDT不僅在工業(yè)界應用廣泛，通常被用于多分類、點擊率預測、搜索排序等任務；在各種數(shù)據(jù)挖掘競賽中也是致命武器，據(jù)統(tǒng)計Kaggle上的比賽有一半以上

發(fā)表于 01-05 14:27 ?2923次閱讀

PyTorch教程5.7之在Kaggle上預測房價

電子發(fā)燒友網(wǎng)站提供《PyTorch教程5.7之在Kaggle上預測房價.pdf》資料免費下載

發(fā)表于 06-05 15:20 ?1次下載

pytorch怎么在pycharm中運行

第一部分：PyTorch和PyCharm的安裝 1.1 安裝PyTorch PyTorch是一個開源的機器學習庫，用于構建和訓練神經(jīng)網(wǎng)絡。要在PyCharm中使用PyTorch，首先需

發(fā)表于 08-01 16:22 ?877次閱讀