stata中将文字型变量值变为数值型，用gen为什么出现type mismatch？

AutoCAD | 朝鲜战争（1950-1953） | 炒股 | 扫地机器人 | 室内设计 | 美国留学 | 丹东市 | 方言 | matlab | 摩纳哥 | PHP | 机器学习 | 山阳县 | centos | 新西兰 | 细胞生物学 | 少数民族 | 工业机器人 | 直升机 | 大学专业 | 东海县 | 张宏伟 | 智利 | 视频会议 | 种植 | 在线教育 | 保险业 | 化学实验 | 首次公开募股（IPO） | C4D | 黄金投资 | 铅山县 | 女性主义 | 文案 | 莎车县 | 东京 | 电厂 | 情商 | iPad | 郭嘉 | 桌面游戏 | 按键精灵 | OneNote | 给排水 | 骑马与砍杀 | 媒体 | 阳信县 | 金融数学 | 小店区 | 航母 | 高中物理 | 插件 | 广告文案 | HTML | 植保无人机 | 外汇投资 | 德邦物流 | 创业团队 | 爬虫（计算机网络） | Spss数据分析 | 电脑硬件 | CSS | 易纲 | 房屋 | 电学 | 遗传学 | 航拍 | pdf | 白兰地 | 互联网创业 | 运载火箭 | 秦岭 | 徐州市 | 绿茶 | 风水堪舆学 | 整容 | Adobe After Effects | 3D Max | 传媒 | 文化差异 | CAD制图 | 民间借贷 | 计算机专业 | 老挝 | 江苏银行 | 韭菜 | 背景音乐（bgm） | 网盘 | 马克思主义 | 私募证券投资基金 | 亲子鉴定 | 外汇 | 虚拟机 | 摄影技巧 | 初中数学 | PMP | Microsoft SQL Server | 五行 | 央视 | 信托 | 公司法 | 软件开发 | 赎回 | 用户界面设计 | 退伍 | 美容整形 | 长城 | 3D打印机 | 塞浦路斯 | 景观设计 | 充电器 | 函数 | 分子生物学 | 名言 | 活动策划 | C#编程 | SEO | 创意 | 王兴 | Apple WATCH | 搜索引擎优化（seo） | 因果 | 宁晋县 | 火灾 | 动物保护 | 董卓 | 文身 | 产品 | 物联网 | 咖啡馆 | 幼儿园教师 | 电气工程及其自动化专业 | 人生规划 | 鱿鱼 | 基金定投 | Apple ID | 日本文化 | 后宫·甄嬛传（书籍） | 火影忍者 | 图形处理器（GPU） | 投资银行 | 建筑设计 | 大脑 | 生命 | 购机咨询 | 传统文化 | 希腊 | 3D | 组装机 | 摄影师 | 企业邮箱 | 语言学 | Microsoft Visual Studio | unity（游戏引擎） | 祛痘 | 国家开发银行 | 大城市 | 中药 | 佛法 | 创业想法 | 淘宝美工 | 气候 | 电风扇 | 黑洞 | .Net开发 | 广告人 | 嵌入式系统 | 图像处理 | 户外广告 | 益生菌 | 人性 | 理科 | 饮料 | 手工艺 | 几何学 | 港股 | 会计学习 | 进化 | 笔记本电脑 | 山地车 | 房地产开发商 | 电路设计 | 中国文化 | 五台山 | 快捷键 | 土地政策 | 汉服 | 显示器 | 茅台酒 | vmware虚拟机 | 重大疾病保险 | DJI大疆创新 | 核电站 | 养老 | 广州市 | Stm32 | 延安 | 嘉兴市 | 显卡 | 债券 |

你的位置：网站首页 >> 频道首页 >>Stata >>stata中将文字型变量值变为数值型，用gen为什么出现type mismatch？

stata中将文字型变量值变为数值型，用gen为什么出现type mismatch？

来源：蜘蛛抓取(WebSpider) 时间：2022-06-04 09:41 标签： stata数值型变成字符型

type mismatch 顾名思义，数据形式不匹配，转换一下数据形式，即字符型和数值型转换一下试试，用tostring 或者destring

你对这个回答的评价是？

下载百度知道APP，抢鲜体验

使用百度知道APP，立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。

如题，数值型变量的长度不同，有8位有9位有十几位的，怎么才能统一取后7位呢？

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

在数据处理中，我们可能需要将多个变量拼接为一个变量。这一操作可以通过replace或gen命令实现。但是，这种方法仅适用于字符型变量的拼接。当各个变量数据类型不同时，Stata将提示“type mismatch”的错误。

例如，当前路径下存在如下数据集：

使用describe命令查看各个变量类型，如下：

可知，变量company和make均为字符型，gear_ratio为浮点型，foreign为字节型，其余的为整值型。我们使用gen命令将变量company和make拼接在一起，公司名和人名用冒号隔开，执行程序与结果如下：

这样，两个字符型变量便拼接在一起了。

但在实际操作中，我们可能还需要拼接更多的变量，较为直接的处理思路是现将变量转换为字符型，其次逐一拼接。但这种方法较为繁琐，尤其是存在多个拼接变量且需添加分隔符时更加难以操作。那么，有没有什么命令可以实现变量快速拼接，并在各个变量间添加分隔符呢？我们介绍两种简单方法。

catenate命令可以将字符型或数值型变量拼接在一起，并生成一个新的字符型变量。在拼接过程中，可自动转化变量类型，并可定义变量拼接范围。其基本语法如下：

其中，punct(punctchars)选项用于定义拼接变量间的分隔符，默认以空格分隔。当然，也可使用punct(no)选项，表示不使用分隔符。

在本例中，我们尝试将数据集中前5行的所有变量进行拼接，并以逗号分隔。执行程序与结果如下：

concat()函数是egen命令自带的一个函数，也可以实现不同类型变量的拼接。其基本语法如下：

其中，format(%fmt)选项可用于定义数值型变量在拼接后的显示样式；decode选择可进行解码；maxlength()选项用于定义变量标签最大长度。在默认情况下，各个变量紧密连接，中间不存在空格等符号。

在本例中，我们依然将所有变量进行拼接，并设置数值型变量的显示样式为%5.3f，变量之间以分号分隔。执行程序与运行结果如下：

通过以上两种方法，我们便实现了变量的快速拼接。尤其是当变量名具有一定规律性，如v1、v2、v3…时，采用以上方法将更加高效，仅需执行“catenate v = v*, p(,)” 或“egen v =concat(v*), p(,)”即可，极大简化了数据处理程序。