当前位置：文档库 › 实验一：预处理

实验一：预处理

实验报告

院系名称：数学与信息学院2016年12月21日

一、实验目的与任务

设计一个程序，实现一个源程序的去处空格，回车，制表符以及注释语句，包括单行注释和多行注释。

二、实验涉及的相关知识点

1.文件的打开和关闭open,close，文件的字符的读取fgetc()和文件指针的定位函数。

2.字符数组的使用，以及if,while等分支循环语句的使用

三、实验内容与过程

1.创建一个文件

2.编写一个预处理程序

3.运行是输入文件名然后回车

四、实验结果及分析

1.实验的结果为：

file name=C:\Users\zhu\Desktop\实验报告\朱小琴\dat.txt

using namespace std; #include #include #include #include void pretreatment(char *s); int main(){ ftream f; f.open() return 0; } char* pretreatment(char* s){ }

2.分析：

我们通过分析，○1.换行回车和制表符和空格为一类，如果他们结合在一起就存储为一个空格○2注释为另外一种情况，它又分为单

行注释和多行注释，分别的处理○3其余的情况就存储到字符数组

里。最后就得出了一个预处理过后的字符数组。五、实验相关说明

本实验用的是Dev-C++的编译器中测试运行的。

六、实验有关附件（如程序、附图、参考资料，等）附件一：实验的代码如下：

using namespace std;

#include

char result[100000];

int length;

void pretreatment();

int main(){

int i;

pretreatment();

for(i=0;i

cout<

}

return 0;

}

/**

*预处理函数

*处理掉多余的空格，tab，换行，回车已经注释信息，使其连接为一个字符串

void pretreatment(){

FILE* fp;

char c,ch,fn[80];

int flag=0;

cout<<"file name=";

cin>>fn;

if((fp=fopen(fn,"r"))==NULL){

cout<<"\n Can not open file!";

exit(1);

}

while((c=fgetc(fp))!=EOF){

//如果是空格的处理方式

if(c==32 || c=='\t' || c=='\n'){

while((c==32 || c=='\t' || c=='\n')&& c!=EOF){

c=fgetc(fp);

}

if(c==EOF)

break;

fseek(fp,-1L,1);

result[length]=' ';

length++;

}

//如果ch=='/'并且下一个ch=='*'的处理方式或者下一个ch=='/'的处理方式

else if(c=='/') {

c=fgetc(fp);

if(c=='*'){

while(flag==0){

c=fgetc(fp);

while(c!='*'&& c!=EOF){ c=fgetc(fp);

}

if(c==EOF){

break;

}

if(c=='*'){

ch=fgetc(fp);

if(ch=='/'){

flag=1;

}

else{

flag=0;

}

else if(c=='/'){

while(c!='\n' && c!=EOF){

c=fgetc(fp);

}

if(c==EOF) {

break;

}

else{

fseek(fp,-1L,1);

c=fgetc(fp);

if(c==EOF)

break;

result[length]=c;

length++;

}

else{

result[length]=c;

length++;

}

fclose(fp);

}

注：（1）第一部分由实验指导老师确定，学生填写；第二至六部分由学生整理完成，详细内容由实验学生附纸完成（包括电子版和书面版两个文档）

（2）主要用于综合性、设计性实验

天津理工大学计算机专业数据库实验二

实验报告学院（系）名称：计算机与通信工程学院姓名范学号2009 专业计算机科学与技术班级中加4班实验项目数据库控制与编程课程名称数据库系统概论课程代码实验时间2011年11月29日实验地点主校区7—219 批改意见成绩教师签字：一．实验目的以一种开发环境为例，使学生初步掌握通过编程的方式对数据库进行操作，为进行数据库课程设计做准备。二．实验工具软硬件环境编写访问数据库的应用程序来对数据库进行各种数据操作，编程工具由导师指定，学生可以使用指导老师指定的工具，也可自己选择编程工具。软件环境：Windows 2000MS SQL Server 硬件环境：P4 2.4GHz 256内存三．实验内容和要求所有的SQL操作均在自己建立的TEMP数据库里进行，根据以下要求认真填写实验报告，并且提交源程序，保证可正确编译运行。使用SQL对数据进行完整性控制，用实验验证：当操作违反了完整性约束条件的时候，系统是如何处理的。熟悉存储过程的建立及使用，熟悉带输入参数和输出参数的存储过程。 I.使用SQL对数据进行完整性控制，用实验验证：当操作违反了完整性约束条件的时候，系统是如何处理的。 II.熟悉存储过程的建立及使用，熟悉带输入参数和输出参数的存储过程。 a)查询学生表中的所有学生，并实现调用。 b)修改学号为@sno学生的姓名，性别，年龄，系别，并实现调用。 c)向学生表中插入学生，并实现调用。 d)查询姓名为@sname选修的数据库课程的成绩，并实现调用。 e)查询选修了课程名为@cname并且成绩高于该门课程平均分的学生学号和成绩，并实现调用。III.利用指定的编程语言完成一个简单程序，要求具有对数据的增加、修改和删除操作；基于一个给定的java应用程序，熟悉掌握建立ODBC和利用ODBC来凝结数据库的编程方法，建立一个应用程序，具有向学生、课程、选课表增加修改删除记录的功能，选取其中一个功能用存储过程实现。需要接取程序运行界面。四. 实验步骤

数据挖掘实验报告(一)

数据挖掘实验报告（一）数据预处理姓名：李圣杰班级：计算机1304 学号：1311610602

一、实验目的 1.学习均值平滑，中值平滑，边界值平滑的基本原理 2.掌握链表的使用方法 3.掌握文件读取的方法二、实验设备 PC一台，dev-c++5.11 三、实验内容数据平滑假定用于分析的数据包含属性age。数据元组中age的值如下（按递增序）：13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70。使用你所熟悉的程序设计语言进行编程，实现如下功能（要求程序具有通用性）： (a) 使用按箱平均值平滑法对以上数据进行平滑，箱的深度为3。 (b) 使用按箱中值平滑法对以上数据进行平滑，箱的深度为3。 (c) 使用按箱边界值平滑法对以上数据进行平滑，箱的深度为3。四、实验原理使用c语言，对数据文件进行读取，存入带头节点的指针链表中，同时计数，均值求三个数的平均值，中值求中间的一个数的值，边界值将中间的数转换为离边界较近的边界值五、实验步骤代码 #include #include #include #define DEEP 3 #define DATAFILE "data.txt" #define VPT 10 //定义结构体 typedef struct chain{ int num; struct chain *next; }* data; //定义全局变量 data head,p,q; FILE *fp; int num,sum,count=0; int i,j; int *box; void mean(); void medain(); void boundary(); int main () { //定义头指针 head=(data)malloc(sizeof(struc t chain)); head->next=NULL; /*打开文件*/ fp=fopen(DATAFILE,"r"); if(!fp) exit(0); p=head; while(!feof(fp)){

实验4数据库的简单查询和连接查询实验

实验4 数据库的简单查询和连接查询实验 1、实验目的本实验的目的是使学生掌握SQL Server查询分析器的使用方法，加深对SQL和SQL语言的查询语句的理解。熟练掌握简单表的数据查询、数据排序和数据连接查询的操作方法。 2、实验时数2学时 3、实验内容该实验在上一个实验的基础上进行简单查询操作 1、求数学系（ma）学生的学号和姓名 select Sno,Sname from Student where Sdept='ma' 2、求选修了课程的学生学号 select Sno srom SC 3、求选修课程号为‘1’的学生号和成绩，并要求对查询结果按成绩的降序排列，如果成绩相同按学号的升序排列。 select Sno,Grade from SC where Cno='1' order by Grade DESC ,Sno ASC 4、求选修课程号为‘1’且成绩在80~90之间的学生学号和成绩，并成绩乘以输出。 select Sno ,Grade* from SC where Grade>=80 and Grade<=90 5、求数学系（ma）或计算机系（cs）姓张的学生的信息。 select * from Student where Sdept in('ma' ,'cs' ) and Sname='张*' 6、求缺少了成绩的学生的学号和课程号 select Sno ,Cno from SC where Grade=0 or Grade=NULL 连接查询操作 7、查询每个学生的情况以及他所选修的课程 select * from Student ,Course 8、求学生的学号、姓名、选修的课程及成绩 select ,Sname,Cname,Grade from Student,SC,Course where = and = 9、求选修课程号为‘1’且成绩在90以上的学生学号、姓名和成绩

数据挖掘数据预处理

XI`AN TECHNOLOGICAL UNIVERSITY 实验报告实验课程名称数据集成、变换、归约和离散化专业：数学与应用数学班级：姓名：学号：实验学时：指导教师：刘建伟成绩： 2016年5月5 日

西安工业大学实验报告专业数学与应用数学班级131003 姓名学号实验课程数据挖掘指导教师刘建伟实验日期2016-5-5 同实验者实验项目数据集成、变换、归约和离散化实验设备计算机一台及器材一实验目的掌握数据集成、变换、归约和离散化二实验分析从初始数据源出发,总结了目前数据预处理的常规流程方法,提出应把源数据的获取作为数据预处理的一个步骤,并且创新性地把数据融合的方法引入到数据预处理的过程中,提出了数据的循环预处理模式,为提高数据质量提供了更好的分析方法,保证了预测结果的质量,为进一步研究挖掘提供了较好的参考模式。三实验步骤 1数据分析任务多半涉及数据集成。数据集成是指将多个数据源中的数据合并并存放到一个一致的数据存储（如数据仓库）中。这些数据源可能包括多个数据库、数据立方体或一般文件。在数据集成时，有许多问题需要考虑。模式集成和对象匹配可能需要技巧。 2数据变换是指将数据转换或统一成适合于挖掘的形式。（1）数据泛化：使用概念分层，用高层概念替换低层或“原始”数据。例如，分类的属性，如街道，可以泛化为较高层的概念，如城市或国家。类似地，数值属性如年龄，可以映射到较高层概念如青年、中年和老年。（2）规范化：将属性数据按比例缩放，使之落入一个小的特定区间。大致可分三种：最小最大规范化、z-score规范化和按小数定标规范化。（3）属性构造：可以构造新的属性并添加到属性集中，以帮助挖掘过程。例如，可能希望根据属性height和width添加属性area。通过属性构造可以发现关于数据属性间联系的丢失信息，这对知识发现是有用的。 3数据经过去噪处理后,需根据相关要求对数据的属性进行相应处理.数据规约就是在减少数据存储空间的同时尽可能保证数据的完整性,获得比原始数据小得

实验一ACCESS数据库及表的操作

可编辑可修改实验一数据库及表的操作实验类型：验证性实验课时：_6_学时指导教师： _______________ 时间：2013年月日课次：第___________________ 节教学周次：第________ 周实验分室：_______________ 实验台号：__________ 实验员：_________________ 一、实验目的 1.掌握数据库的创建及其它简单操作 2.熟练掌握数据表建立、数据表维护、数据表的操作二、实验内容与要求 1.数据库的创建、打开、关闭 2.数据表的创建：建立表结构、设置字段属性、建立表之间关系、数据的输入 3.数据表维护：打开表、关闭表、调整表外观、修改表结构、编辑表内容 4?数据表的操作：查找替换数据、排序记录、筛选记录三、实验步骤案例一：创建数据库 1.创建空数据库要求：建立“教学管理.accdb ”数据库，并将建好的数据库文件保存在“实验一”文件夹中。操作步骤：

IS 1 丿小? e 叮亍 Micrtilitil ftfdwvi 口可审业 a 站 j-t 4审时 OffiCfLC WF gm ■ *陆（2）单击険'I 按钮，在打开的“新建数据库”对话框中，选择数据库的保存位置，在“ 件夹中，单击“确定”按钮，如图 1-2所示。（3）这时返回到access 启动界面，显示将要创建的数据库的名称和保存位置，如果用户未提供文件扩展名，access 将自动添加上。（4 ）在右侧窗格下面，单击“创建”命令按钮，如图 1-1所示。（5）这时开始创建空白数据库，自动创建了一个名称为表 1的数据表，并以数据表视图方式打开这个表1,如图1-3所示。 J 曰归图1-1 创建教学管理数据库（1 ）在Access 2010启动窗口中，在中间窗格的上方，单击“空数据库” ，在右侧窗格的文件名文本框中，给出一个默认的文件名“” 。把它修改为“教学管理”如图 1-1所示。实验一”文

实验二、数据预处理

实习二、数据预处理一、预处理简介 ERDAS IMAGING数据预处理模块是由一组实用的图像数据处理工具构成，包括生成单值图像（Creat New Image）、三维地形表面（Create Surface）、图像分幅裁剪（Subset Image）、图像几何校正（Image Geometric Correction）、图像拼接处理（Mosaic Images）、非监督分类（Unsupervised Classification）、以及图像投影变换（Reprojection Images）等，主要是根据工作区域的地理特征和专题信息提取的客观需要，对数据输入模块中获取的IMG图像文件进行范围调整、误差校正、坐标转换等处理，以便进一步开展图像解译、专题分类等分析研究。数据预处理模块简称Data Preparation或DataPrep，可以通过两种途径启动： ERDAS图标面板菜单条：Main→Data Preparation→Data Preparation菜单（图2.1）ERDAS图标面板工具条：点击DataPrep 图标→Data Preparation菜单（图2.1）图2.1 Data Preparation菜单从图2.1可以看出，ERDAS IMAGIMG数据预处理模块包括了7项主要功能，其中第一项

功能（生成单值图像）比较简单，第六项功能（非监督分类）将在图像分类中进行说明。下面将主要介绍其余五项功能，重点是图像几何校正和图像拼接处理，因为这两项操作是从事遥感应用研究必须开展的基本工作过程。二、三维地形表面（3D Surfacing）三维地形表面工具允许用户在不规则空间点的基础上产生三维地形表面，所支持的输入数据类型包括：ASCII码点文件、ArcInfo的Coverage点文件和线文件，ERDAS IMAGING 的注记数据层，以及栅格图像文件IMG。所有输入数据必须具有X、Y、Z值，三维地形表面工具所应用的TIN插值方法，所输出的是一个连续的栅格图像文件。每一个已知的空间点在输出的地形表面上保持Z值不变，而没有Z值的空间点，其输出表面的Z值是基于TIN 其周围的已知点插值计算获得的。在三维地形表面工具中提供了两种TIN插值方法：线性插值（Linera）与非线性插值（non-linear）。线性插值方法是应用一次多项式方程进行计算，输出的TIN三角面是一些有棱角的平面；非线性插值方法应用五次多项式方程进行计算，输出的是平滑表面，这种情况下，TIN 三角面不是一个平面，而是具有弹性的曲面。线性插值方法速度快但结果简单，而非线性插值方法产生基于不规则分布数据集的非常连续的、圆滑的表面结果。 1.启动三维地形表面（Surfacing Create Surface） ERDAS 图标面板菜单条：Main→Data Preparation菜单 →选择Create Surface→打开3D Surfacing对话框（图2.2）ERDAS 图标面板工具条：点击Data Pre

数据挖掘实验报告资料

大数据理论与技术读书报告 -----K最近邻分类算法指导老师: 陈莉学生姓名: 李阳帆学号: 201531467 专业: 计算机技术日期 :2016年8月31日

摘要数据挖掘是机器学习领域内广泛研究的知识领域，是将人工智能技术和数据库技术紧密结合，让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式，以满足人们不同应用的需要。K 近邻算法（KNN）是基于统计的分类方法，是大数据理论与分析的分类算法中比较常用的一种方法。该算法具有直观、无需先验统计知识、无师学习等特点，目前已经成为数据挖掘技术的理论和应用研究方法之一。本文主要研究了K 近邻分类算法，首先简要地介绍了数据挖掘中的各种分类算法，详细地阐述了K 近邻算法的基本原理和应用领域，最后在matlab环境里仿真实现，并对实验结果进行分析，提出了改进的方法。关键词：K 近邻，聚类算法，权重，复杂度，准确度

1.引言 (1) 2.研究目的与意义 (1) 3.算法思想 (2) 4.算法实现 (2) 4.1 参数设置 (2) 4.2数据集 (2) 4.3实验步骤 (3) 4.4实验结果与分析 (3) 5.总结与反思 (4) 附件1 (6)

1.引言随着数据库技术的飞速发展，人工智能领域的一个分支—— 机器学习的研究自 20 世纪 50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据，用机器学习的方法来分析数据，挖掘大量数据背后的知识，这两者的结合促成了数据库中的知识发现（Knowledge Discovery in Databases，简记 KDD）的产生，也称作数据挖掘（Data Ming，简记 DM）。数据挖掘是信息技术自然演化的结果。信息技术的发展大致可以描述为如下的过程：初期的是简单的数据收集和数据库的构造；后来发展到对数据的管理，包括：数据存储、检索以及数据库事务处理；再后来发展到对数据的分析和理解，这时候出现了数据仓库技术和数据挖掘技术。数据挖掘是涉及数据库和人工智能等学科的一门当前相当活跃的研究领域。数据挖掘是机器学习领域内广泛研究的知识领域，是将人工智能技术和数据库技术紧密结合，让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式，以满足人们不同应用的需要[1]。目前，数据挖掘已经成为一个具有迫切实现需要的很有前途的热点研究课题。 2.研究目的与意义近邻方法是在一组历史数据记录中寻找一个或者若干个与当前记录最相似的历史纪录的已知特征值来预测当前记录的未知或遗失特征值[14]。近邻方法是数据挖掘分类算法中比较常用的一种方法。K 近邻算法（简称 KNN）是基于统计的分类方法[15]。KNN 分类算法根据待识样本在特征空间中 K 个最近邻样本中的多数样本的类别来进行分类，因此具有直观、无需先验统计知识、无师学习等特点，从而成为非参数分类的一种重要方法。大多数分类方法是基于向量空间模型的。当前在分类方法中，对任意两个向量： x= ) ,..., , ( 2 1x x x n和) ,..., , (' ' 2 ' 1 'x x x x n 存在 3 种最通用的距离度量：欧氏距离、余弦距离[16]和内积[17]。有两种常用的分类策略：一种是计算待分类向量到所有训练集中的向量间的距离：如 K 近邻选择K个距离最小的向量然后进行综合，以决定其类别。另一种是用训练集中的向量构成类别向量，仅计算待分类向量到所有类别向量的距离，选择一个距离最小的类别向量决定类别的归属。很明显，距离计算在分类中起关键作用。由于以上 3 种距离度量不涉及向量的特征之间的关系，这使得距离的计算不精确，从而影响分类的效果。

2-实验二MySQL数据库操作实验

实验二MySQL数据库操作实验实验目的： 1、掌握MySQL数据库的安装方法 2、掌握MySQL数据库的使用 3、熟悉数据库管理工具的使用实验要求： 1、利用MySQL命令创建数据库和相应的数据库表，并能向数据库表中插入数据记录和相应的数据库操作。 2、利用Navicat for MySQL建数据库和相应的数据库表，并能向数据库表中插入数据记录和相应的数据库操作。 3、保存和导入数据库 4、编程查询显示数据库表中的所有记录，可以选择以下添加的任意一个数据库表的记录。实验内容： 1、安装MySQL数据库安装MySQL可以参照文档“MySQL 5 安装.doc”，安装MySQL并进行配置，安装成功后，即可操作管理数据库。方法一：从开始菜单?MySQL?MySQL Server5.0?MySQL Command Line Client，打开控制台界面，提示输入密码，密码输入成功后，登录MySQL数据库，如下图2.1所示。

图2.1 登录MySQL 服务器方法二：将MySQL的安装路径下的bin目录添加到环境变量path中，打开控制台命令，输入mysql –uroot –p，在提示符下输入密码，登录MySQL 服务器，如下图2.2所示。图2.2 登录MySQL服务器 2、安装Navicat for MySQL Navicat for MySQL 是一款强大的MySQL数据库管理和开发工具，Navicat 使用很好的GUI，可以使用户采用一种安全和更容易的方式创建、组织、存取和共享信息。安装Navicat_for_MySQL_10.1.7，安装向导启动界面如下图2.3所示。

数据挖掘实验报告三

实验三一、实验原理 K-Means算法是一种 cluster analysis 的算法，其主要是来计算数据聚集的算法，主要通过不断地取离种子点最近均值的算法。在数据挖掘中，K-Means算法是一种cluster analysis的算法，其主要是来计算数据聚集的算法，主要通过不断地取离种子点最近均值的算法。算法原理： (1) 随机选取k个中心点； (2) 在第j次迭代中，对于每个样本点，选取最近的中心点，归为该类； (3) 更新中心点为每类的均值； (4) j<-j+1 ,重复(2)(3)迭代更新，直至误差小到某个值或者到达一定的迭代步数，误差不变. 空间复杂度o(N) 时间复杂度o(I*K*N) 其中N为样本点个数，K为中心点个数，I为迭代次数二、实验目的： 1、利用R实现数据标准化。 2、利用R实现K-Meams聚类过程。 3、了解K-Means聚类算法在客户价值分析实例中的应用。三、实验内容依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。对其进行标准差标准化并保存后，采用k-means算法完成客户的聚类，分析每类的客户特征，从而获得每类客户的价值。编写R程序，完成客户的k-means聚类，获得聚类中心与类标号，并统计每个类别的客户数

四、实验步骤 1、依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。

2、确定要探索分析的变量 3、利用R实现数据标准化。 4、采用k-means算法完成客户的聚类，分析每类的客户特征，从而获得每类客户的价值。

五、实验结果客户的k-means聚类，获得聚类中心与类标号，并统计每个类别的客户数六、思考与分析使用不同的预处理对数据进行变化，在使用k-means算法进行聚类，对比聚类的结果。 kmenas算法首先选择K个初始质心，其中K是用户指定的参数，即所期望的簇的个数。这样做的前提是我们已经知道数据集中包含多少个簇. 1.与层次聚类结合经常会产生较好的聚类结果的一个有趣策略是，首先采用层次凝聚算法决定结果

实验二、数据预处理

实习二、数据预处理一、预处理简介数据预处理模块是由一组实用的图像数据处理工具构成，包括生成单值图像（）、三维地形表面（）、图像分幅裁剪（）、图像几何校正（）、图像拼接处理（）、非监督分类（）、以及图像投影变换（）等，主要是根据工作区域的地理特征和专题信息提取的客观需要，对数据输入模块中获取的图像文件进行范围调整、误差校正、坐标转换等处理，以便进一步开展图像解译、专题分类等分析研究。数据预处理模块简称或，可以通过两种途径启动：图标面板菜单条：→→菜单（图）图标面板工具条：点击图标→菜单（图）图菜单从图可以看出，数据预处理模块包括了项主要功能，其中第一项功能（生成单值图像）比较简单，第六项功能（非监督分类）将在图像分类中进行说明。下面将主要介绍其余五项功能，重点是图像几何校正和图像拼接处理，因为这两项操作是从事遥感应用研究必须开展的基本工作过程。二、三维地形表面（）三维地形表面工具允许用户在不规则空间点的基础上产生三维地形表面，所支持的输入数据类型包括：码点文件、的点文件和线文件，的注记数据层，以及栅格图像文件。所有输入数据必须具有、、值，三维地形表面工具所应用的插值方法，所输出的是一个连续的栅格图像文件。每一个已知的空间点在输出的地形表面上保持值不变，而没有值的空间点，其输出表面的值是基于其周围的已知点插值计算获得的。在三维地形表面工具中提供了两种插值方法：线性插值（）与非线性插值（）。线性插值方法是应用一次多项式方程进行计算，输出的三角面是一些有棱角的平面；非线性插值方法应用五次多项式方程进行计算，输出的是平滑表面，这种情况下，三角面不是一个平面，而是具有弹性的曲面。线性插值方法速度快但结果简单，而非线性插值方法产生基于不规则

实验二数据库操作

实验二SQL Server 2005 数据库的创建修改与管理一、实验目的与要求 1．实验目的：掌握使用SSMS创建、修改、删除、压缩数据库的方法。 2．实验要求：了解SQL Server 2005 数据库的逻辑结构和物理结构及其结构特点，掌握使用SSMS创建、修改、删除，压缩数据库的方法，明确能够创建数据库的用户必须是系统管理员，或是被授权使用CREATE DA TABASE语句的用户，创建数据库必须要确定数据库名、所有者(即创建数据库的用户)、数据库大小(最初的大小、最大的大小、是否允许增长的方式)和存储数据的文件。二、实验内容 1、创建数据库用ssms：右击数据库/ 新建数据库或选定数据库→单击操作菜单→新建数据库例：创建一个数据库uvw 命令方式创建：例：创建一个数据库aaa，其余默认,查看aaa信息 create database aaa exec sp_helpdb aaa 使用create database语句创建: create database 库名 on primary ( name=’数据库名’,filename=’数据库文件全称’,size=大小,maxsize=最大尺寸,filegrowth=增长率) log on (name=日志名,filename=’日志文件全名称’, size=大小,maxsize=最大尺寸,filegrowth=增长率) 例：创建一个名为dan的学生库,主数据库文件dan_data.mdf,初始大小4mb,事务日志文件 dan_log.ldf，初始容量为4mb,文件存于C盘根目录,分别用菜单与命令方式实现。例：菜单方式创建（T-SQL语言选作）：创建一个gz数据库,该数据库的主文件逻辑名称为gz_data,物理文件名为gz.mdf,初始大小为5mb,最大尺寸为3mb,增长速度为10%;数据库的日志文件逻辑名称为gz_log,物理文件名为gz.ldf,初始大小为3mb,最大尺寸为5mb,增长速度为2MB,文件存放在d:\。 2、修改数据库例：将数据库dan的数据文件和日志文件分别扩展2个文件例：修改数据文件dan_data1的空间大小为5mb

遥感图像预处理实验报告

实验前准备：遥感图像处理软件认识 1、实验目的与任务： ①熟悉ENVI软件，主要是对主菜单包含内容的熟悉； ②练习影像的打开、显示、保存；数据的显示，矢量的叠加等。 2、实验设备与数据设备：遥感图像处理系统ENVI4.4软件；数据：软件自带数据和河南焦作市影响数据。 3、实验内容与步骤： ⑴ENVA软件的认识如上图所示，该软件共有12个菜单，每个菜单都附有下拉功能，里面分别包含了一些操作功能。 ⑵打开一幅遥感数据选择File菜单下的第一个命令，通过该软件自带的数据打开遥感图像，可知，打开一幅遥感影像有两种显示方式。一种是灰度显示，另一种是RGB显示。 Gray（灰度显示）RGB显示 ⑶保存数据 ①选择图像显示上的File菜单进行保存； ②通过主菜单上的Save file as进行保存

⑷光谱库数据显示选择Spectral > Spectral Libraries > Spectral Library Viewer。将出现Spectral Library Input File 对话框，允许选择一个波谱库进行浏览。点击“Open Spectral Library”，选择某一所需的波谱库。该波谱库将被导入到Spectral Library Input File 对话框中。点击一个波谱库的名称，然后点击“OK”。将出现Spectral Library Viewer 对话框，供选择并绘制波谱库中的波谱曲线。 ⑸矢量化数据点选显示菜单下的Tools工具栏，接着选择下面的第四个命令，之后选择第一个命令，对遥感图像进行矢量化。点击鼠标左键进行区域选择，选好之后双击鼠标右键，选中矢量化区域。 ⑹矢量数据与遥感影像的叠加与切割选择显示菜单下的Tools工具，之后点选第一个 Link命令，再选择其下面的第一个命令，之后 OK，结束程序。选择主菜单下的Basic Tools 菜单，之后选择其中的第二个命令，在文件选择对话框中，选择输入的文件（可以根据需要构建任意子集），将出现Spatial Subset via ROI Parameters 对话框通过点击矢量数据名，选择输入的矢量数据。使用箭头切换按钮来选择是否遮蔽不包含在矢量数据中的像元。遥感图像的辐射定标 1、实验目的与任务： ①了解辐射定标的原理； ②使用ENVI软件自带的定标工具定标； ③学习使用波段运算进行辐射定标。 2、实验内容与步骤： ⑴辐射定标的原理辐射定标就是将图像的数字量化值（DN）转化为辐射亮度值或者反射率或者表面温度等

垃圾渗滤液预处理的试验研究

2013年第39卷第12期工业安全与环保 D ecem ber2013I ndust r i al Saf e t y a nd Envi r onm e nt al Pr o t ect i on27 垃圾渗滤液预处理的试验研究李凯1王磊1李武1向芳芳2王服群1 (1．中钢集团武汉安全环保研究院有限公司武汉430081；2．深圳东江环保有限公司广东深圳518057) 摘要采用离心法在不同条件下对渗滤液预处理悬浮物的去除效果进行了研究，试验结果表明，当离心机转速为3000r／m i n、离心时间为3m i n时，混合液和吹脱进水悬浮物的去除效果最好，悬浮物去除效率分别达到96％、45％以上。关键词离心混合液吹脱进水悬浮物 Experi m ent al s t udy on P r e t r e a l m e nt f or L andf i l l Lea e ha t e u K ai l W A N G Lei l LI W ul X I A N G Fangf t醑W A N G Fuqunl (1．S／nost e e／W uha n S,Cet r&E ndr onm ent a／Prot ect／on R e sea r c h I nst i t u t e C o．，Lt d．I F uhan430081) A bst r act T he eent ri fngaf i on pr oces s i s appl i e d t o l'也'[10Ve t he s us pended sol i ds i n l ea ehat e．The expe r i m ent a l r esul t s al l ow t hat t he r em oval ef f i ci ency af m i x ed l i qu or a nd st r i p pi ng i nf l ow w at er SS c an r e ac h96％a nd45％磁弘甜v由under t he瑚 l o,ang eondi f i om t hat t he r ot at i on sp∞ds of c em Ii fi ge i s3000r／m i n a nd t he eent r i f ugal l on t i m e i s t hr ee珊【I nl【∞． 1【ey W or ds eent ri fngat i on m i x ed l i q uor st r i p pi ng i nf l ow w at er8118pende d sol i d 0引言垃圾渗滤液是指来源于垃圾填埋场中垃圾本身含有的水分、进入填埋场的雨雪水及其他水分，扣除垃圾、覆土层的饱和持水量，并经历垃圾层和覆土层而形成的一种高浓度废水。渗滤液是一种成分复杂的高浓度有机废水，其性质取决于垃圾成分、垃圾的粒径、压实程度、现场的气候、水文条件和填埋时间等因素，一般来说有以下特点： (1)水质复杂，危害性大。有研究表明，运用G f i —M S联用技术对垃圾渗滤液中有机污染物成分进行分析，共检测出垃圾渗滤液中主要有机污染物63种，可信度在60％以上的有34种。其中，烷烯烃6种，羧酸类19种，酯类5种，醇、酚类10种，醛、酮类10种，酰胺类7种，芳烃类1种，其他5种。其中已被确认为致癌物1种，促癌物、辅致癌物4种，致突变物1种，被列入我国环境优先污染物“黑名单”的有6种。 (2)C O D和B O D浓度高。渗滤液中C O D和 B O D最高分别可达90000m g／L、38000m g／L甚至更高。 (3)氨氮含量高，并且随填埋时间的延长而升高，最高可达3000m g／L。渗滤液中的氮多以氨氮形式存在，约占T N K40％一50％。 (4)水质变化大。根填埋场的年龄，垃圾渗滤液分为两类：一类是填埋时间在5年以下的年轻渗滤液，其特点是C O D、B O D浓度高，可生化性强；另一类是填埋时间在5年以上的年老渗滤液，由于新鲜垃圾逐渐变为陈腐垃圾，其pH值接近中性，C O D 和B O D浓度有所降低，BO D／C O D比值减小，氨氮浓度增加。 (5)金属含量较高。垃圾渗滤液中含有十多种金属离子，其中铁和锌在酸性发酵阶段较高，铁的质量浓度可达2000m g／L左右，锌的质量浓度可达130m g／L左右，铅的质量浓度可达12．3叫江，钙的质量浓度甚至达到4300m g／L。 (6)渗滤液中的微生物营养元素比例失调，主要是C、N、P的比例失调。深圳下坪渗滤液处理厂(以下简称“下坪厂”)于2002年5月投入运行，处理水量800矗／d，出水水质按照生活垃圾填埋污染控制标准(G B1688卜1997)三级控制标准设计…1。采用的处理工艺：原水一石灰混合池一一级反应池一一级沉淀池一一级集水井一吹脱塔一二级反应池一二级沉淀池斗二级集水井一uA SB—s B R。随着人们对垃圾渗滤液处理的日益重视，国家对渗滤液的排放标准也越来越严格，2008年颁布了生活垃圾填埋场污染控制标准(G B 16889---2008)。为达到新的渗滤液排放标准，下坪厂于2008年对原有的处理工艺进行了改扩建和增加深度处理工程。改扩建后的下坪厂处理水量1500m3／d ，排放

数据库系统原理课程基本实验设置

目录每个实验包括：实验内容实验要求实验环境(可选) 实验背景知识(可选) 实验步骤及结果分析实验总结

第一章概述数据库课程的学习需要理论和实践的紧密结合，数据库实验是数据库学习的重要的环节。我们将针对数据库学习的实验环节进行实验设置和指导，包括数据库实验需要的知识、环境和内容的设置。数据库课程的目标是：理解和掌握数据库的理论知识。学生理解数据库系统的基本概念，掌握数据库系统的基本理论，包括数据库的特点、结构、关系数据模型、数据存储、数据查询及优化、关系数据库设计、事务管理等内容。了解和熟悉数据库的使用和基本操作，掌握数据访问方法。在学生掌握基本的数据库概念和理论的基础上，培养学生的实践能力，学生能掌握基本的数据库的操作。全面理解数据库系统，能进行数据库的设计，最终能完成一个完整的数据库应用系统的设计和实现。数据库实验是为上面的目标服务，其内容的设置要和数据库的理论学习结合起来。根据课程进展和学生掌握的数据库系统知识的提高，数据库的实验分为两个大的部分。一个是和课程紧密相关的,和课程同步的实验，一是在数据库设计理论结束或在课程理论教学完成后进行的数据库系统的设计实验。这里的实验指导将是针对和数据库的理论学习同步的课程实验。课程实验目的：通过实验加深学生对数据库相关基本理论和概念的认识和理解，通过对SQL SERVER的操作和使用，了解一种具体的数据库管理系统，熟悉数据库的操作，提高学生数据库实践能力。课程实验环境：在实验中，我们选择Kingbase数据库作为基本的实验环境，操作系统可以是Windows2000/XP, 在课程实验中需要用到KingBase的管理工具企业管理器，并用ISQL语言完成实验操作。实验方式和要求：课程实验要求每一个学生独立完成；学生需要理解每一次实验内容，先掌握和了解相关的理论知识，然后制定实验步骤，完成实验内容；课程实验虽然分次完成，但其在内容上是连贯的，前一次实验的数据可能为后面的实验所用，因此每一次实验结果需要保留；实验完后，要完成实验报告，写清楚实验内容、实验步骤和实验结果。实验内容设置：课程基本实验根据理论学习的内容，包括如下8组实验：实验一数据库安装、数据库创建与维护实验；实验二数据库表/视图的创建与维护实验；实验三数据查询实验；实验四数据库接口实验；实验五数据库完整性与安全性实验；实验六数据查询分析实验；实验七数据库事务的创建与运行实验；实验八数据库的备份与恢复实验；

河北工业大学数据挖掘实验报告

实验一数据预处理一、实验目的 1、熟悉 VC++编程工具和完全数据立方体构建、联机分析处理算法。 2、浏览拟被处理的的数据，发现各维属性可能的噪声、缺失值、不一致性等，针对存在的问题拟出采用的数据清理、数据变换、数据集成的具体算法。 3、用 VC++编程工具编写程序，实现数据清理、数据变换、数据集成等功能。 4、调试整个程序获得清洁的、一致的、集成的数据，选择适于全局优化的参数。 5、写出实验报告。二、实验原理 1、数据预处理现实世界中的数据库极易受噪音数据、遗漏数据和不一致性数据的侵扰，为提高数据质量进而提高挖掘结果的质量，产生了大量数据预处理技术。数据预处理有多种方法：数据清理，数据集成，数据变换，数据归约等。这些数据处理技术在数据挖掘之前使用，大大提高了数据挖掘模式的质量，降低实际挖掘所需要的时间。 2、数据清理数据清理例程通过填写遗漏的值，平滑噪音数据，识别、删除离群点，并解决不一致来“清理”数据。 3、数据集成数据集成将数据由多个源合并成一致的数据存储，如数据仓库或数据立方体。 4、数据变换通过平滑聚集，数据概化，规化等方式将数据转换成适用于数据挖掘的形式。 5、数据归约使用数据归约可以得到数据集的压缩表示，它小得多，但能产生同样（或几乎同样的）分析结果。常用的数据归约策略有数据聚集、维归约、数据压缩和数字归约等。三、实验容和步骤 1、实验容 1、用 VC++编程工具编写程序，实现数据清理、数据变换、数据集成等功能，并在实验报告中写出主要的预处理过程和采用的方法。 2、产生清洁的、一致的、集成的数据。 3、在试验报告中写明各主要程序片段的功能和作用。 2、实验步骤 1）仔细研究和审查数据，找出应当包含在你分析中的属性或维，发现数据中的一些错误、不寻常的值、和某些事务记录中的不一致性。 2）进行数据清理，对遗漏值、噪音数据、不一致的数据进行处理。例如：1、日期中的缺失值可以根据统一的流水号来确定。 2、购买的数量不能为负值。 3）进行数据集成和数据变换和数据归约，将多个数据源中的数据集成起来，

数据库原理实验报告(2)资料

南京晓庄学院《数据库原理与应用》课程实验报告实验二数据库的创建、管理、备份及还原实验所在院(系):信息工程学院班级： 13软件工程转本1班学号：13131151 姓名：薛伟

1.实验目的 (1)掌握分别使用SQL Server Management Studio图形界面和Transact-SQL语句创建和修改数据库的基本方法； (2)学习使用SQL Server查询分析窗口接收Transact-SQL语句和进行结果分析。 (3)了解SQL Server的数据库备份和恢复机制，掌握SQL Server中数据库备份与还原的方法。 2.实验要求 (1)使用SQL Server Management Studio创建“教学管理”数据库。 (2)使用SQL Server Management Studio修改和删除“教学管理”数据库。 (3)使用Transact-SQL语句创建“教学管理”数据库。 (4)使用Transact-SQL语句修改和删除“教学管理”数据库。 (5)使用SQL Server Management Studio创建“备份设备”；使用SQL Server Management Studio对数据库“教学管理”进行备份和还原。 (6)SQL Server 2005数据库文件的分离与附加。 (7)按要求完成实验报告 3.实验步骤、结果和总结实验步骤/结果 (1) 总结使用SQL Server Management Studio创建、修改和册除“TM”(教学管理）数据库的过程。利用Microsoft SQL Server Management Studio创建数据库的示例方法如下：一、打开安装好的Microsoft SQL Server Management Studio，在对象资源管理器里找到【数据库】--右键【新建数据库】，到下图界面： 1、在数据库名称处输入要创建数据库的名称。 2、表格中的两个路径分别为： 2.1 上为数据库存放物理地址。 2.2 下为数据库日志存放物理地址。 3、初始大小图片中显示的为默认的值，可以根据自己的需求进行修改大小，要修改大小【点击大小值表格】会出现编辑状态文本框。

数据挖掘分类实验详细报告概论

《数据挖掘分类实验报告》信息安全科学与工程学院 1120362066 尹雪蓉数据挖掘分类过程（1）数据分析介绍本次实验为典型的分类实验，为了便于说明问题，弄清数据挖掘具体流程，我们小组选择了最经典的决策树算法进行具体挖掘实验。（2）数据准备与预处理在进行数据挖掘之前，我们首先要对需要挖掘的样本数据进行预处理，预处理包括以下步骤： 1、数据准备，格式统一。将样本转化为等维的数据特征（特征提取），让所有的样本具有相同数量的特征，同时兼顾特征的全面性和独立性 2、选择与类别相关的特征（特征选择） 3、建立数据训练集和测试集 4、对数据集进行数据清理在本次实验中，我们选择了ILPD (Indian Liver Patient Dataset) 这个数据集，该数据集已经具有等维的数据特征，主要包括Age、Gender、TB、DB、Alkphos、Sgpt、Sgot、TP、ALB、A/G、classical，一共11个维度的数据特征，其中与分类类别相关的特征为classical，它的类别有1,2两个值。详见下表：本实验的主要思路是将该数据集分成训练集和测试集，对训练集进行训练生成模型，然后再根据模型对测试集进行预测。数据集处理实验详细过程：

●CSV数据源处理由于下载的原始数据集文件Indian Liver Patient Dataset (ILPD).csv（见下图）中间并不包含属性项，这不利于之后分类的实验操作，所以要对该文件进行处理，使用Notepad文件，手动将属性行添加到文件首行即可。 ●平台数据集格式转换在后面数据挖掘的实验过程中，我们需要借助开源数据挖掘平台工具软件weka，该平台使用的数据集格式为arff，因此为了便于实验，在这里我们要对csv文件进行格式转换，转换工具为weka自带工具。转换过程为： 1、打开weka平台，点击”Simple CLI“，进入weka命令行界面，如下图所示： 2、输入命令将csv文件导成arff文件，如下图所示: 3、得到arff文件如下图所示：内容如下：

实验报告数据库的基本查询'

一、实验目的：通过该实验掌握应用SQL 查询数据库的基本方法，包括单表、多表查询。二、实验原理数据库查询是数据库的核心操作。SQL语言提供了SELECT语句进行数据库的查询。 SELECT[ALL|DISTINCT] <目标列表达式〉[，<目标列表达式〉]... FROM<表名或视图名〉[，<表名或视图名〉]... [WHERE<条件表达式>] [GROUP BY<列名1〉[HA VING<条件表达式>]] [ORDERBY<列名2〉[ASC|DESC]] 三、实验内容和方法实验用的数据库：用实验二建立的数据库：School 1. 投影查询 (1) 查询SC表的sno的不重复记录。使用SQL语句：“select distinct Sno from SC”，得出结果如下图所示： (2) 改变查询结果的标题名：sno为学号,sname为姓名,ssex 为性别,sdept 为系名。使用SQL语句：“select Sno 学号,Sname 姓名,Ssex 性别,Sdept 系名from Student”，得出结果如下图所示：

(3) 查询STUDENT表的前3条记录（top 3)。使用SQL语句：“select top 3 * from Student”，得出结果如下图所示： 3. 选择查询 (1) 查询成绩在60-80之间的姓名、系名和成绩。使用SQL语句：“select Sname,Sdept,Grade from Student,SC where Grade>60 and Grade<80 and Student.Sno=SC.Sno”，结果如下图所示：若使用SQL语句：“select Sname,Sdept,Grade from Student,SC where Grade between 60 and 80 and Student.Sno=SC.Sno”，则结果如下图所示： (2) 查询信息系和计算机系的姓名和成绩。使用SQL语句：“select Sname,Grade from Student,SC where Sdept='IS' and Student.Sno=SC.Sno or Sdept='CS' and Student.Sno=SC.Sno”，结果如下图所示：

实验一：预处理

天津理工大学计算机专业数据库实验二

数据挖掘实验报告(一)

实验4数据库的简单查询和连接查询实验

数据挖掘数据预处理

实验一ACCESS数据库及表的操作

实验二、数据预处理

数据挖掘实验报告资料

2-实验二MySQL数据库操作实验

数据挖掘实验报告三

实验二、数据预处理

实验二 数据库操作

遥感图像预处理实验报告

垃圾渗滤液预处理的试验研究

数据库系统原理课程基本实验设置

河北工业大学数据挖掘实验报告

数据库原理实验报告(2)资料

数据挖掘分类实验详细报告概论

实验报告 数据库的基本查询'

实验二数据库操作

实验报告数据库的基本查询'