# 云计算 **Repository Path**: chen-yingfu/cloud-computing ## Basic Information - **Project Name**: 云计算 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-10-09 - **Last Updated**: 2024-10-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 基于 ECS 服务的 API 开发 - 基于 ECS 和 OBS 服务 ## 使用大模型生成 10 个关于如何用机器学习或大模型做聚类分析的“文本”文件(txt 或 markdown 格式),并上传到一个obs桶内。 使用AIchatOS帮我们生成10个关于如何用机器学习或大模型做聚类分析。 ![输入图片说明](1.png) ![输入图片说明](2.png) 上传到一个obs桶内。 ![输入图片说明](3.png) ## 编写一个针对一批文本文件的内容进行聚类分析的程序。 import pandas as pd import matplotlib.pyplot as plt from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.cluster import KMeans from sklearn.decomposition import PCA # 读取文本文件 with open('./聚类/如何用机器学习或大模型做聚类分析.txt', 'r', encoding='utf-8') as file: documents = file.readlines() # 清理文档(去除换行符) documents = [doc.strip() for doc in documents] # 文本数据转化为TF-IDF特征向量 vectorizer = TfidfVectorizer() X = vectorizer.fit_transform(documents) # 选择聚类的数量 num_clusters = 3 # KMeans聚类 kmeans = KMeans(n_clusters=num_clusters, random_state=0, n_init= 'auto') kmeans.fit(X) # 获取聚类标签 labels = kmeans.labels_ # 使用PCA降维到2D pca = PCA(n_components=2) X_pca = pca.fit_transform(X.toarray()) # 绘制聚类效果图 plt.figure(figsize=(8, 6)) for i in range(num_clusters): plt.scatter(X_pca[labels == i, 0], X_pca[labels == i, 1], label=f'Cluster {i}') # 标注每个点 for i, doc in enumerate(documents): plt.annotate(f'Doc {i}', (X_pca[i, 0], X_pca[i, 1])) plt.title('KMeans Clustering of Text Data') plt.xlabel('PCA Component 1') plt.ylabel('PCA Component 2') plt.legend() plt.grid() plt.show() ## 使用华为 ecs 实例,获取 obs 桶内的文本文件后运行上一步的聚类分析程序,并呈现分析结果。 获取obs桶内的文本文件 进入obs的obsutil_linux_amd64_5.5.12目录 cd obsutil_linux_amd64_5.5.12 下载obs桶内的文本文件 ./obsutil cp obs://cyf666/如何用机器学习或大模型做聚类分析.txt /temp/如何用机器学习或大模型做聚类分析.txt ![输入图片说明](4.png) 将项目部署到宝塔面板,并安装好Flask库 ![输入图片说明](5.png) 启动项目 ![输入图片说明](6.png) 终端输入命令,得到聚类的结果 python 聚类.py ![输入图片说明](7.png)