python怎么做数据清洗？

作者：Lianne & Justin

在拟合机器学习或统计模型之前，我们通常需要清洗数据。用杂乱数据训练出的模型无法输出有意义的结果。

数据清洗：从记录集、表或数据库中检测和修正（或删除）受损或不准确记录的过程。它识别出数据中不完善、不准确或不相关的部分，并替换、修改或删除这些脏乱的数据。

「数据清洗」光定义就这么长，执行过程肯定既枯燥又耗时。为了将数据清洗简单化，本文介绍了一种新型完备分步指南，支持在 Python 中执行数据清洗流程。读者可以学习找出并清洗以下数据的方法：

缺失数据；

不规则数据（异常值）；

不必要数据：重复数据（repetitive data）、复制数据（duplicate data）等；

不一致数据：大写、地址等；

该指南使用的数据集是 Kaggle 竞赛 Sberbank 俄罗斯房地产价值预测竞赛数据（该项目的目标是预测俄罗斯的房价波动）。本文并未使用全部数据，仅选取了其中的一部分样本。在进入数据清洗流程之前，我们先来看一下数据概况。

# import packages
import pandas as pd
import numpy as np
import seaborn as sns


import matplotlib.pyplot as plt
import matplotlib.mlab as mlab
import matplotlib
plt.style.use('ggplot')
from matplotlib.pyplot import figure


%matplotlib inline
matplotlib.rcParams['figure.figsize'] = (12,8)

pd.options.mode.chained_assignment = None

# read the data
df = pd.read_csv('sberbank.csv')


# shape and data types of the data
print(df.shape)
print(df.dtypes)


# select numeric columns
df_numeric = df.select_dtypes(include=[np.number])
numeric_cols = df_numeric.columns.values
print(numeric_cols)


# select non numeric columns
df_non_numeric = df.select_dtypes(exclude=[np.number])
non_numeric_cols = df_non_numeric.columns.values
print(non_numeric_cols)

从以上结果中，我们可以看到该数据集共有 30,471 行、292 列，还可以辨别特征属于数值变量还是分类变量。这些都是有用的信息。现在，我们可以浏览「脏」数据类型检查清单，并一一攻破。开始吧！ 缺失数据 处理缺失数据/缺失值是数据清洗中最棘手也最常见的部分。很多模型可以与其他数据问题和平共处，但大多数模型无法接受缺失数据问题。

如何找出缺失数据？

本文将介绍三种方法，帮助大家更多地了解数据集中的缺失数据。方法 1：缺失数据热图当特征数量较少时，我们可以通过热图对缺失数据进行可视化。

cols = df.columns[:30] # first 30 columns
colours = ['#000099', '#ffff00'] # specify the colours - yellow is missing. blue is not missing.
sns.heatmap(df[cols].isnull(), cmap=sns.color_palette(colours))

下表展示了前 30 个特征的缺失数据模式。横轴表示特征名，纵轴表示观察值/行数，黄色表示缺失数据，蓝色表示非缺失数据。例如，下图中特征 life_sq 在多个行中存在缺失值。而特征 floor 只在第 7000 行左右出现零星缺失值。

缺失数据热图方法 2：缺失数据百分比列表当数据集中存在很多特征时，我们可以为每个特征列出缺失数据的百分比。

# if it's a larger dataset and the visualization takes too long can do this.
# % of missing.
for col in df.columns:
    pct_missing = np.mean(df[col].isnull())
    print('{} - {}%'.format(col, round(pct_missing*100)))

得到如下列表，该表展示了每个特征的缺失值百分比。具体而言，我们可以从下表中看到特征 life_sq 有 21% 的缺失数据，而特征 floor 仅有 1% 的缺失数据。该列表有效地总结了每个特征的缺失数据百分比情况，是对热图可视化的补充。

前 30 个特征的缺失数据百分比列表方法 3：缺失数据直方图在存在很多特征时，缺失数据直方图也不失为一种有效方法。要想更深入地了解观察值中的缺失值模式，我们可以用直方图的形式进行可视化。

# first create missing indicator for features with missing data
for col in df.columns:
    missing = df[col].isnull()
    num_missing = np.sum(missing)


    if num_missing > 0:  
        print('created missing indicator for: {}'.format(col))
        df['{}_ismissing'.format(col)] = missing




# then based on the indicator, plot the histogram of missing values
ismissing_cols = [col for col in df.columns if 'ismissing' in col]
df['num_missing'] = df[ismissing_cols].sum(axis=1)


df['num_missing'].value_counts().reset_index().sort_values(by='index').plot.bar(x='index', y='num_missing')

直方图可以帮助在 30,471 个观察值中识别缺失值状况。例如，从下图中可以看到，超过 6000 个观察值不存在缺失值，接近 4000 个观察值具备一个缺失值。

缺失数据直方图 如何处理缺失数据？ 这方面没有统一的解决方案。我们必须研究特定特征和数据集，据此决定处理缺失数据的最佳方式。下面介绍了四种最常用的缺失数据处理方法。不过，如果情况较为复杂，我们需要创造性地使用更复杂的方法，如缺失数据建模。解决方案 1：丢弃观察值在统计学中，该方法叫做成列删除（listwise deletion），需要丢弃包含缺失值的整列观察值。只有在我们确定缺失数据无法提供信息时，才可以执行该操作。否则，我们应当考虑其他解决方案。此外，还存在其他标准。例如，从缺失数据直方图中，我们可以看到只有少量观察值的缺失值数量超过 35。因此，我们可以创建一个新的数据集 df_less_missing_rows，该数据集删除了缺失值数量超过 35 的观察值。

# drop rows with a lot of missing values.
ind_missing = df[df['num_missing'] > 35].index
df_less_missing_rows = df.drop(ind_missing, axis=0)

解决方案 2：丢弃特征与解决方案 1 类似，我们只在确定某个特征无法提供有用信息时才丢弃它。例如，从缺失数据百分比列表中，我们可以看到 hospital_beds_raion 具备较高的缺失值百分比——47%，因此我们丢弃这一整个特征。

# hospital_beds_raion has a lot of missing.
# If we want to drop.
cols_to_drop = ['hospital_beds_raion']
df_less_hos_beds_raion = df.drop(cols_to_drop, axis=1)

解决方案 3：填充缺失数据当特征是数值变量时，执行缺失数据填充。对同一特征的其他非缺失数据取平均值或中位数，用这个值来替换缺失值。当特征是分类变量时，用众数（最频值）来填充缺失值。以特征 life_sq 为例，我们可以用特征中位数来替换缺失值。

# replace missing values with the median.
med = df['life_sq'].median()
print(med)
df['life_sq'] = df['life_sq'].fillna(med)

此外，我们还可以对所有数值特征一次性应用同样的填充策略。

# impute the missing values and create the missing value indicator variables for each numeric column.
df_numeric = df.select_dtypes(include=[np.number])
numeric_cols = df_numeric.columns.values


for col in numeric_cols:
    missing = df[col].isnull()
    num_missing = np.sum(missing)


    if num_missing > 0:  # only do the imputation for the columns that have missing values.
        print('imputing missing values for: {}'.format(col))
        df['{}_ismissing'.format(col)] = missing
        med = df[col].median()
        df[col] = df[col].fillna(med)

很幸运，本文使用的数据集中的分类特征没有缺失值。不然，我们也可以对所有分类特征一次性应用众数填充策略。

# impute the missing values and create the missing value indicator variables for each non-numeric column.
df_non_numeric = df.select_dtypes(exclude=[np.number])
non_numeric_cols = df_non_numeric.columns.values


for col in non_numeric_cols:
    missing = df[col].isnull()
    num_missing = np.sum(missing)


    if num_missing > 0:  # only do the imputation for the columns that have missing values.
        print('imputing missing values for: {}'.format(col))
        df['{}_ismissing'.format(col)] = missing


        top = df[col].describe()['top'] # impute with the most frequent value.
        df[col] = df[col].fillna(top)

解决方案 4：替换缺失值对于分类特征，我们可以添加新的带值类别，如 _MISSING_。对于数值特征，我们可以用特定值（如-999）来替换缺失值。这样，我们就可以保留缺失值，使之提供有价值的信息。

# categorical
df['sub_area'] = df['sub_area'].fillna('_MISSING_')


# numeric
df['life_sq'] = df['life_sq'].fillna(-999)

不规则数据（异常值） 异常值指与其他观察值具备显著差异的数据，它们可能是真的异常值也可能是错误。 如何找出异常值？ 根据特征的属性（数值或分类），使用不同的方法来研究其分布，进而检测异常值。方法 1：直方图/箱形图当特征是数值变量时，使用直方图和箱形图来检测异常值。下图展示了特征 life_sq 的直方图。

# histogram of life_sq.
df['life_sq'].hist(bins=100)

由于数据中可能存在异常值，因此下图中数据高度偏斜。

直方图为了进一步研究特征，我们来看一下箱形图。

# box plot.
df.boxplot(column=['life_sq'])

从下图中我们可以看到，异常值是一个大于 7000 的数值。

箱形图方法 2：描述统计学对于数值特征，当异常值过于独特时，箱形图无法显示该值。因此，我们可以查看其描述统计学。例如，对于特征 life_sq，我们可以看到其最大值是 7478，而上四分位数（数据的第 75 个百分位数据）是 43。因此值 7478 是异常值。

df['life_sq'].describe()

方法 3：条形图当特征是分类变量时，我们可以使用条形图来了解其类别和分布。例如，特征 ecology 具备合理的分布。但如果某个类别「other」仅有一个值，则它就是异常值。

# bar chart -  distribution of a categorical variable
df['ecology'].value_counts().plot.bar()

条形图其他方法：还有很多方法可以找出异常值，如散点图、z 分数和聚类，本文不过多探讨全部方法。 如何处理异常值？ 尽管异常值不难检测，但我们必须选择合适的处理办法。而这高度依赖于数据集和项目目标。处理异常值的方法与处理缺失值有些类似：要么丢弃，要么修改，要么保留。（读者可以返回上一章节处理缺失值的部分查看相关解决方案。） 不必要数据 处理完缺失数据和异常值，现在我们来看不必要数据，处理不必要数据的方法更加直接。输入到模型中的所有数据应服务于项目目标。不必要数据即无法增加价值的数据。这里将介绍三种主要的不必要数据类型。 不必要数据类型 1：信息不足/重复 有时一个特征不提供信息，是因为它拥有太多具备相同值的行。如何找出重复数据？我们可以为具备高比例相同值的特征创建一个列表。例如，下图展示了 95% 的行是相同值的特征。

num_rows = len(df.index)
low_information_cols = [] #


for col in df.columns:
    cnts = df[col].value_counts(dropna=False)
    top_pct = (cnts/num_rows).iloc[0]


    if top_pct > 0.95:
        low_information_cols.append(col)
        print('{0}: {1:.5f}%'.format(col, top_pct*100))
        print(cnts)
        print()

我们可以逐一查看这些变量，确认它们是否提供有用信息。（此处不再详述。）

如何处理重复数据？我们需要了解重复特征背后的原因。当它们的确无法提供有用信息时，我们就可以丢弃它。 不必要数据类型 2：不相关 再次强调，数据需要为项目提供有价值的信息。如果特征与项目试图解决的问题无关，则这些特征是不相关数据。如何找出不相关数据？浏览特征，找出不相关的数据。例如，记录多伦多气温的特征无法为俄罗斯房价预测项目提供任何有用信息。如何处理不相关数据？当这些特征无法服务于项目目标时，删除之。 不必要数据类型 3：复制 复制数据即，观察值存在副本。复制数据有两个主要类型。复制数据类型 1：基于所有特征如何找出基于所有特征的复制数据？这种复制发生在观察值内所有特征的值均相同的情况下，很容易找出。我们需要先删除数据集中的唯一标识符 id，然后删除复制数据得到数据集 df_dedupped。对比 df 和 df_dedupped 这两个数据集的形态，找出复制行的数量。

# we know that column 'id' is unique, but what if we drop it?
df_dedupped = df.drop('id', axis=1).drop_duplicates()


# there were duplicate rows
print(df.shape)
print(df_dedupped.shape)

我们发现，有 10 行是完全复制的观察值。

如何处理基于所有特征的复制数据？删除这些复制数据。复制数据类型 2：基于关键特征如何找出基于关键特征的复制数据？有时候，最好的方法是删除基于一组唯一标识符的复制数据。例如，相同使用面积、相同价格、相同建造年限的两次房产交易同时发生的概率接近零。我们可以设置一组关键特征作为唯一标识符，比如 timestamp、full_sq、life_sq、floor、build_year、num_room、price_doc。然后基于这些特征检查是否存在复制数据。

key = ['timestamp', 'full_sq', 'life_sq', 'floor', 'build_year', 'num_room', 'price_doc']


df.fillna(-999).groupby(key)['id'].count().sort_values(ascending=False).head(20)

基于这组关键特征，我们找到了 16 条复制数据。

如何处理基于关键特征的复制数据？删除这些复制数据。

# drop duplicates based on an subset of variables.


key = ['timestamp', 'full_sq', 'life_sq', 'floor', 'build_year', 'num_room', 'price_doc']
df_dedupped2 = df.drop_duplicates(subset=key)


print(df.shape)
print(df_dedupped2.shape)

删除 16 条复制数据，得到新数据集 df_dedupped2。

不一致数据 在拟合模型时，数据集遵循特定标准也是很重要的一点。我们需要使用不同方式来探索数据，找出不一致数据。大部分情况下，这取决于观察和经验。不存在运行和修复不一致数据的既定代码。下文介绍了四种不一致数据类型。 不一致数据类型 1：大写 在类别值中混用大小写是一种常见的错误。这可能带来一些问题，因为 Python 分析对大小写很敏感。如何找出大小写不一致的数据？我们来看特征 sub_area。

df['sub_area'].value_counts(dropna=False)

它存储了不同地区的名称，看起来非常标准化。

但是，有时候相同特征内存在不一致的大小写使用情况。「Poselenie Sosenskoe」和「pOseleNie sosenskeo」指的是相同的地区。如何处理大小写不一致的数据？为了避免这个问题，我们可以将所有字母设置为小写（或大写）。

# make everything lower case.
df['sub_area_lower'] = df['sub_area'].str.lower()
df['sub_area_lower'].value_counts(dropna=False)

不一致数据类型 2：格式 我们需要执行的另一个标准化是数据格式。比如将特征从字符串格式转换为 DateTime 格式。如何找出格式不一致的数据？特征 timestamp 在表示日期时是字符串格式。

df

如何处理格式不一致的数据？使用以下代码进行格式转换，并提取日期或时间值。然后，我们就可以很容易地用年或月的方式分析交易量数据。

df['timestamp_dt'] = pd.to_datetime(df['timestamp'], format='%Y-%m-%d')
df['year'] = df['timestamp_dt'].dt.year
df['month'] = df['timestamp_dt'].dt.month
df['weekday'] = df['timestamp_dt'].dt.weekday


print(df['year'].value_counts(dropna=False))
print()
print(df['month'].value_counts(dropna=False))

相关文章：https://towardsdatascience.com/how-to-manipulate-date-and-time-in-python-like-a-boss-ddea677c6a4d 不一致数据类型 3：类别值 分类特征的值数量有限。有时由于拼写错误等原因可能出现其他值。如何找出类别值不一致的数据？我们需要观察特征来找出类别值不一致的情况。举例来说：由于本文使用的房地产数据集不存在这类问题，因此我们创建了一个新的数据集。例如，city 的值被错误输入为「torontoo」和「tronto」，其实二者均表示「toronto」（正确值）。识别它们的一种简单方式是模糊逻辑（或编辑距离）。该方法可以衡量使一个值匹配另一个值需要更改的字母数量（距离）。已知这些类别应仅有四个值：「toronto」、「vancouver」、「montreal」和「calgary」。计算所有值与单词「toronto」（和「vancouver」）之间的距离，我们可以看到疑似拼写错误的值与正确值之间的距离较小，因为它们只有几个字母不同。

from nltk.metrics import edit_distance

df_city_ex = pd.DataFrame(data={'city': ['torontoo', 'toronto', 'tronto', 'vancouver', 'vancover', 'vancouvr', 'montreal', 'calgary']})

df_city_ex['city_distance_toronto'] = df_city_ex['city'].map(lambda x: edit_distance(x, 'toronto'))
df_city_ex['city_distance_vancouver'] = df_city_ex['city'].map(lambda x: edit_distance(x, 'vancouver'))
df_city_ex

如何处理类别值不一致的数据？我们可以设置标准将这些拼写错误转换为正确值。例如，下列代码规定所有值与「toronto」的距离在 2 个字母以内。

msk = df_city_ex['city_distance_toronto'] <= 2
df_city_ex.loc[msk, 'city'] = 'toronto'

msk = df_city_ex['city_distance_vancouver'] <= 2
df_city_ex.loc[msk, 'city'] = 'vancouver'


df_city_ex

不一致数据类型 4：地址 地址特征对很多人来说是老大难问题。因为人们往数据库中输入数据时通常不会遵循标准格式。如何找出地址不一致的数据？用浏览的方式可以找出混乱的地址数据。即便有时我们看不出什么问题，也可以运行代码执行标准化。出于隐私原因，本文采用的房地产数据集没有地址列。因此我们创建具备地址特征的新数据集 df_add_ex。

# no address column in the housing dataset. So create one to show the code.
df_add_ex = pd.DataFrame(['123 MAIN St Apartment 15', '123 Main Street Apt 12   ', '543 FirSt Av', '  876 FIRst Ave.'], columns=['address'])
df_add_ex

我们可以看到，地址特征非常混乱。

如何处理地址不一致的数据？运行以下代码将所有字母转为小写，删除空格，删除句号，并将措辞标准化。

df_add_ex['address_std'] = df_add_ex['address'].str.lower()
df_add_ex['address_std'] = df_add_ex['address_std'].str.strip() # remove leading and trailing whitespace.
df_add_ex['address_std'] = df_add_ex['address_std'].str.replace('\.', '') # remove period.
df_add_ex['address_std'] = df_add_ex['address_std'].str.replace('\bstreet\b', 'st') # replace street with st.
df_add_ex['address_std'] = df_add_ex['address_std'].str.replace('\bapartment\b', 'apt') # replace apartment with apt.
df_add_ex['address_std'] = df_add_ex['address_std'].str.replace('\bav\b', 'ave') # replace apartment with apt.


df_add_ex

现在看起来好多了：

结束了！我们走过了长长的数据清洗旅程。现在你可以运用本文介绍的方法清洗所有阻碍你拟合模型的「脏」数据了。

编辑：黄飞

阅读全文

数据处理(28212) 数据处理(28212)
机器学习(130422) 机器学习(130422)
python(83364) python(83364)
数据集(24278) 数据集(24278)

Python做机器学习的重要库

开发用 Python 做机器学习不得不收藏的重要库

2020-06-10 09:24:55

Python数据如何分析

Python数据分析：seaborn

2020-05-29 16:34:57

Python中常用的数据类型

数据类型是每种编程语言必备属性，只有给数据赋予明确的数据类型，计算机才能对数据进行处理运算，因此，正确使用数据类型是十分必要的，不同的语言，数据类型类似，但具体表示方法有所不同，以下是Python

2018-04-19 15:14:08

Python存储数据详解

在Python开发中，数据存储、读取是必不可少的环节，而且可以采用的存储方式也很多，常用的方法有json文件、csv文件、MySQL数据库、Redis数据库以及Mongdb数据库等。1. json

2018-03-29 15:47:28

Python就业岗位详解

BOSS再也不用担心你没有数据。做爬虫工程师的的薪资为20K起，当然，因为大数据，薪资也将一路上扬。四、Python web全栈工程师全栈工程师是指掌握多种技能，并能利用多种技能独立完成产品的人。也叫全端

2018-05-02 16:38:33

Python的分类数据

《利用Python进行数据分析》 121 分类数据

2019-10-31 09:27:55

python 数据分析基础 day12－python调用mysql

python 数据分析基础 day12－python调用mysql

2019-10-23 13:34:58

python数据分析的类库

Python之所以这么流行，这么好用，就是因为Python提供了大量的第三方的库，开箱即用，非常方便，而且还免费哦，学Python的同学里估计有30%以上是为了做数据分析师或者数据挖掘，所以数据

2018-05-10 15:18:11

python在日常工作中到底有了哪些应用

python在硬件中的应用，但是讲的非常泛泛。今天我就以我的实际经验来讲一下python在我的日常工作中到底有了哪些应用，我到底是怎么做的。最后还会简单讲一下作为一个硬件工程师要怎么去学python。这里借用一下...

2021-07-15 06:32:33

python的数据类型有哪些？

python的数据类型有哪些？Python定义函数一般格式是什么？

2021-12-27 06:26:40

做仪表的，用qt怎么做的？

做仪表的，用qt怎么做的？问：不知道做仪表的，用qt怎么做的？目前用是的EK140P全功能板，我用此工具编译

2018-12-21 10:22:52

怎么做CANopen开发

怎么做CANopen开发

2016-09-20 16:01:05

怎么做图像识别？

怎么做图像识别

2015-07-22 23:23:16

怎么做才能确保来自FPGA的信号在clk和数据之间具有正确的时序相位关系

嗨，我需要通过FPGA内部的源同步信号，我该怎么做才能确保来自FPGA的信号在clk和数据之间具有正确的时序相位关系。与输入的相同。我可以复制两个输出。请指教。

2020-05-22 14:19:26

怎么做智能小车

怎么做智能小车？那位大神有资料？发点我学习下{:4:}

2014-03-21 22:14:49

CRC-8，verilog怎么做除法运算

请问由八位的输入数据，怎么得到CRC编码后的16位数据啊？verilog里面怎么做除法运算？

2014-10-25 20:05:44

GAGE数据采集卡LabVIEW实时采集显示，处理数据，该怎么做？

中需要用LabVIEW实时采集显示，处理数据，该怎么做？希望有用过这个数据采集卡的朋友给一些指导，也希望有朋友能提供一些这个数据采集卡的中文资料，在此感谢大家了

2015-05-18 20:48:27

Hadoop计数器的作用和数据清洗

Hadoop计数器的应用以及数据清洗

2019-11-04 09:19:29

IGBT驱动电路电源怎么做？

小白请问下图中的+15V和 -8V的电源是怎么做的。为什么我看他们做的是单一电源供电

2016-04-18 20:27:20

LabVIEW的数据采集系统交互式界面怎么做？

LabVIEW的数据采集系统交互式界面怎么做，比如在前面板点击“采集数据”就开始运行数据采集模块，点击“实时显示”就可以看到采集到的数据波形图，点击“信号分析”就会看到相应的频谱和相关性分析的图像等。这个总界面怎么做啊，求高手指点！

2015-04-20 11:29:53

PCBA的清洗工艺介绍

　　1、全自动化的在线式清洗机　　一种全自动化的在线式清洗机，该清洗机针对SMT/THT的PCBA焊接后表面残留的松香助焊剂、水溶性助焊剂、免清洗性助焊剂/焊膏等有机、无机污染物进行彻底有效的清洗

2021-02-05 15:27:50

PCBA设计缺陷对清洗的影响

`请问PCBA设计缺陷对清洗的影响有哪些？`

2020-01-17 16:53:08

RFID数据清洗仿真实验

最近在看RFID数据清洗相关知识，关于仿真实在无从下手，有么有大神，指导指导俺

2013-07-26 18:07:34

VeriLog 开平方怎么做？

VeriLog 开平方怎么做？

2014-10-11 14:09:23

allgro 16.3怎么做PCB的开槽

allgro 16.3怎么做PCB的开槽请教大家，allgro 16.3怎么做pcb的开槽?就是需要把一小块PCB的区域对应的整个叠层全部被挖空，做出一个开槽。怎么操作才能实现呢？谢谢！

2014-10-20 17:16:52

ch579使用phy开启rx的时候，接收多个设备的数据要怎么做？

ch579使用phy开启rx的时候，接收多个设备的数据要怎么做？急！！！

2022-08-22 07:51:37

labview 的清零功能怎么做？

labview做串口通讯，经常遇到有些AD模块，其值并不在零点，这个清零的功能怎么做呢？

2019-04-17 10:26:42

labview怎么做视觉

点击学习>>《龙哥手把手教你学LabVIEW视觉设计》视频教程我是刚开始学习labview，想问下用labview做视觉系统怎么做，我要学些什么？

2017-09-30 22:07:31

labview串口接收的数据乘以一个矩阵怎么做？

从串口接收的数据，如图，想把数值乘以一个6×6的矩阵，再以相同格式显示出来，怎么做呢？真心求解，谢谢

2016-09-12 15:29:28

labview串口采集程序，在接收时想发送数据怎么做？

labview串口采集程序，在接收时想发送数据怎么做？在最中间的循环里是数据采集，我如果想在接收的时候发送数据进行更改下位机配置，这个怎么写程序？我采集波形，希望这段代码效率高一些，就是发送的时候执行一次，之后接收的时候就不执行检测我琢磨了半天没想明白，大哥们帮个忙。

2020-08-26 21:56:45

labview函数发生器怎么做？

函数发生器怎么做？急求！！！！！！！！！！！

2012-05-15 19:43:05

labview存储数据时，具体需要存储几列不确定，怎么做呀？怎么把未存的那列直接不显示

labview存储数据时，具体需要存储几列不确定，怎么做呀？怎么把未存的那列直接不显示

2016-07-23 11:41:44

labview重命名怎么做？

大文件复制删除不好做，调用DOS命令怎么做

2021-03-11 09:44:41

pcb3d封装怎么做

pcb3d封装怎么做

2013-08-07 15:06:20

stm8s103怎么做串口转USB键盘？

stm8s103怎么做串口转USB键盘，不要求速度，数据传输量很低，串口数据发送给stm8s103然后再用模拟usb接入电脑，串口输出什么数据电脑就等于键盘输入什么数据，波特率固定

2023-11-06 07:37:55

【agps】如果单片机要通过运营商的gprs下载星历数据，那要怎么做=

如果单片机要通过运营商的gprs下载星历数据，那要怎么做怎么下==

2016-01-26 21:34:31

今年电赛控制怎么做？

控制怎么做啊？飞机啊肿么办

2013-08-28 16:34:31

使用函数计算对表格存储中数据做简单清洗

在函数计算中对新增的数据做简单的清洗、转换、聚合计算等操作，并将清洗之后的数据写回到表格存储的结果表中，并对原始明细数据及结果数据提供实时访问。下面，我们使用函数计算对表格存储中的数据做简单的清洗，并

2018-05-16 23:03:29

单片机下载口怎么做

单片机下载口怎么做（求原理图及说明）

2012-03-23 10:47:48

基于Python的数据分析

《利用Python进行数据分析》 113日期范围、频率和移位

2020-05-01 11:24:11

如何完成机器学习的项目流程和数据清洗

机器学习：完整机器学习项目流程，数据清洗

2020-04-26 09:31:46

对于任意一组没有规律的数据，想要截取一定幅值之上的点数该怎么做？

`对于任意一组没有规律的数据，想要截取一定幅值之上的点数该怎么做`

2018-03-18 10:40:12

将EXCEL导入后，表格能改动怎么做？

各位高手，请教一下，我将EXCEL表格导入到LABVIEW后，还希望能改动导入后表格内的数据，该怎么做？请高手指点，谢谢！

2014-01-15 10:21:22

屏幕选择怎么做？

我想做一个在显示屏上输入，然后对应的灯就会发亮功能的东西该怎么做？灯管有五十个！应该怎么做？求各路大神指点

2012-10-21 16:21:27

怎么有效学习Python数据分析？

Python在人工智能、机器学习领域受到火热追捧，很大程度上在于它拥有非常庞大的第三方库，以及强大的通用编程性能。因此，快速掌握Python进行数据分析，就是学习Python各种第三方库、工具包

2018-06-28 15:18:14

想入门STM32，怎么做呀

想入门STM32，怎么做啊，还有，想先画个STM的PCB，应该看什么样的原理图啊？求大神指路

2015-08-10 15:23:35

想用labview做三维动画仿真加速度传感器数据该怎么做？求...

想用labview做三维动画仿真加速度传感器数据该怎么做？求大神指教{:4:}

2013-07-07 11:31:50

我想做一个这样的曲线波形图怎么做

我想做一个这样的曲线波形图怎么做要实时显示数据用的我现在只能做成这样的0点的x y和刻度都在下边我想都做到中间去应该怎么做求高人指点

2017-09-09 19:37:23

数组转为数值怎么做

刚爱LABVIEW学习遇到问题。一个32位数值，我想把变成二进制数是不是用布尔数组做就可以了。然后我想把前8位取出来，转为数值要怎么做，求高手帮忙，谢谢。

2012-10-19 12:28:17

文本形式的表格数据清洗

对一组文本形式的表格数据清洗：分离每行第一列元素的汉字与数字将文本转为表格

2019-04-28 16:44:56

新手求帮助，这个封装怎么做

` 本帖最后由苦逼中的苦逼于 2013-8-26 17:32 编辑这个封装怎么做。。`

2013-08-26 17:32:35

无线遥控。产生正磁场和负磁场的小机器怎么做

无线遥控。产生正磁场和负磁场的小机器怎么做我想请教大师，无线遥控。产生正磁场和负磁场的小机器怎么做越小越好，长距离遥控，

2010-12-23 04:13:26

明天labviEW考试求大神教下这几个怎么做

明天labviEW考试求大神教下这几个怎么做生成一个excel随机二维数组读取excel中的数据，并将它记录为二进制文件。读取二进制数据，并将它记录为文本文件。读取excel中的数据，并生成波形图

2012-12-25 17:03:22

浅析Python数据结构与算法

Python数据结构是由哪些部分组成的？

2021-10-20 06:43:46

测距的程序怎么做呀

测距的程序怎么做呀

2012-05-24 22:53:29

用labview做暂停和继续怎么做，求程序

用labview做暂停和继续怎么做，求程序

2012-09-03 14:37:57

用labview显示数据，想隔几个点显示一次，怎么做

请问一下，用labview接收数据并显示，由于接受的数据频率很快，这样如果每个数据都显示的话，前面板数字框变化太快，看不清。所以想隔几个点显示一次，中间的某些点不显示出来，这样前面板变化就能看清。这该怎么做呢?

2014-10-27 17:11:26

石化的仪表特殊的产品怎么做的？

石化的仪表特殊的产品怎么做的？

2015-05-21 11:30:58

请教各位，这样要求的怎么做？

本帖最后由 gk320830 于 2015-3-4 10:59 编辑请教各位，这样要求的怎么做：微处理芯片1.5G以上，需移植android系统（android4.0以上系统安卓系统，也可用

2015-01-20 20:02:06

请教大家一个问题 labview软件能在labview的显示界面里实时显示接收的数据吗怎么做呢

请教大家一个问题 labview软件能在labview的显示界面里实时显示接收的数据吗 怎么做呢希望能详细点

2016-05-03 13:54:10

请问怎么做啊

请问怎么做啊请问怎么做啊请问怎么做啊请问怎么做啊请问怎么做啊

2014-03-19 21:28:07

请问怎么做断点调试？

sqlite的源码还是太多了，怎么做断点调试？我想看看他的SELECT一张表是怎么实现的，还有哪个page跟B tree在代码里到底是怎么用的？

2020-05-27 10:52:04

请问STM32扩展USART怎么做

STM32扩展USART怎么做

2019-01-07 08:42:22

请问在使用AD7768的时候，怎么做CRC检验？

大家好，在使用AD7768的时候，怎么做CRC检验？我按照手册上来做的时候，等不到ADC输出的检验值。但我按照官网上的AD7779 CRC CALCULATOR 却能等到相应的值。我就是按照这个方式来做的：循环冗余校验确保正确的数据通信 | 亚德诺半导体。待会儿可以上传代码。谢谢！

2018-08-01 08:37:32

请问激光编码方案怎么做

哪位做过激光编码方案，怎么做

2019-04-22 06:35:48

请问点阵*的封装怎么做**？

请教点阵***的封装怎么做呢

2018-07-19 04:49:19

请问用TLC2543芯片和单片机做一个模拟数据采集器怎么做？

请问用TLC2543芯片和单片机做一个模拟数据采集器怎么做？有人能帮忙做一个吗谢谢了

2014-11-25 21:59:01

请问语音识别怎么做

语音识别怎么做

2018-08-20 08:00:01

请问这个是怎么做的？

[最近在看用labview做iphone界面，看到拖拽屏幕的那部分，有个界面是这样的，好像是用选项卡做的，但具体不太清楚，请各位大侠们看看，指点一下，具体是怎么做的。attachimg]30079[/attachimg]

2011-07-25 11:38:32

谁知道***怎么做SMT程序

谁知道***怎么做SMT程序

2011-02-27 17:30:23

这个控件怎么做，叫啥名

看到别人做的项目里有这个，截了个图，各位大神有没有知道怎么做的

2020-03-13 18:33:55

这个背景是怎么做的呢

`这个背景是怎么做的呢？就那个工业流程图是有图形库还是？？？`

2013-09-08 09:33:28

这种数据采集面板怎么做啊

大侠们，有人会做这个吗，这种面板怎么做啊{:4:}

2014-02-15 17:09:37

逆变电源怎么做啊？

逆变电源怎么做啊？资料找得不完整，急求

2015-07-30 18:46:31

通过VISA怎么做兼容

想问下，一台设备有串口、网口，我们通过VISA做兼容，直接调用，大致怎么做啊，求指教一下

2019-07-22 08:13:03

面阵CCD的数据采集应该怎么做？

目前想做到的是CCD实时采集样品的热辐射，不太懂数据采集卡的原理。CCD是128*128的，采集到的数据是怎么样的？如果放到labview用矩阵显示，是一个128*128的不断变化的数字矩阵？系统应该怎么连线？小白不是很懂这个应该怎么做？求大神给点思路。

2017-01-09 14:51:13

飞机仪表面板的仿真怎么做

飞机仪表面板的仿真怎么做啊，一点头绪都没有，谢谢大家....

2014-03-11 21:17:57

Pandas数据清洗(1)#Python

数据函数代码python

未来加油dz发布于 2023-08-23 18:50:05

Pandas数据清洗(2)#Python

数据函数代码python

未来加油dz发布于 2023-08-23 18:51:00

Pandas数据清洗(3)#Python

数据函数代码python

未来加油dz发布于 2023-08-23 18:52:09

python串口接收数据

本文主要介绍了python串口接收数据。其中涉及了Python使用线程来接收串口数据，以及python3 Serial 串口助手的接收读取数据。详细了介绍了串口接收数据的程序开发过程。

2018-01-15 09:52:42

45222

有什么方法去清洗基于粒子滤波的RFID数据

为确定RFID数据流的清洗效果，我们定义：准确率 ACC=清洗后结果和真实值相等的数据/N个测试数据。

2019-12-09 14:38:40

603

从Excel到Python数据分析进阶指南资源下载

中pandas库用于数据处理，我们从1787页的pandas官网文档中总结出最常用的36个函数，通过这些函数介绍如何通过Python完成数据生成和导入、数据清洗、预处理，以及最常见的数据分类，数据筛选，分类汇总，透视等最常见的操作。6异步社区会员 lizhimiao（18926120246）专享尊重

2021-04-06 09:44:59