【Python】dataframeの行を指定条件で削除する

Python

dataframeで指定の値を含む行を削除する方法

自分が扱ったデータの中に、時折欠損値を表す、string型の文字が入った値が複数の行の中に混じっていました。詳しい状況としては、’car_weight’のcolumnに’計不’というstring型の欠損値を表すデータが入っていて、通常の値はint型。この問題を解決するために、’計不’の文字を任意の値(ここでは1)に置き換えるよう以下のコードを書いて対処した。

 

 

Can only use .str accessor with string values, which use np.object_ dtype in pandas

がしかし、先ほどのコードを打ち込むと↑のエラーが返ってきた。どうやら欠損値以外のデータがint型のため、str関数が使えないらしい。ここでstackoverflowで解決方法が記載されていたため、以下のようにしてコードを書き換えた。

 

 

car_weightのcolumnの値を一度全てstring型に変換するように「astype(str)関数」を挟むことでうまくいきました。

 

参考サイト

Pandas error: Can only use .str accessor with string values, which use np.object_ dtype in pandas
I have data in my .txt file as below: 029070 ***** 190101010600 270 36 OVC ** 0.0 ** ** I want to extract 190101 from the column 3, I am getting AttributeErro...

番外:その他おすすめの記事

開発がもっと快適に、楽しくなるアイテムを紹介します。アイテム1つで開発の楽しさが全然変わるので、良いアイテムにはじゃんじゃんお金を投資すると良いですよ。

おすすめアイテム①

自分はオフィス次の2点の座布団と背もたれクッションを利用してます。姿勢が安定し、お尻への負担が激減します。オフィスにいるのに自宅で作業しているような感覚になるので気に入ってます。また疲労感もかなり減るので費用対効果が非常に高いアイテムです。

おすすめアイテム②

ブックスタンドみなさん使ってますか?PCを打ちながら参考書見る時に手で抑える必要がなくなるので非常に便利です。自分も購入した時なんでいままで使ってなかたんだろうと後悔したのでまだ持ってない方は買っておくと作業効率があがります。

おすすめアイテム③

PCスタンド、magic keyboard、magic mouseを購入してから、開発効率があがり、身体的負担が減って快適に開発ができるようになりました。

エンジニアの基礎知識・教養

別の記事でエンジニアとして知っておくべき技術本についてまとめました。初心者には最低限読んでおいて欲しい技術本をまとめました。例えば「リーダブルコード」などは技術力の高いエンジニアなら必ず過去に読んでいる本だと思います。

時短アイテム!日々の生活の質を上げる

日常生活における無駄を省く表品をまとめました。1日無駄な作業時間が10分発生するとしたら1年間で3600時間もその無駄な作業に時間を費やすことになります。このような魔の作業を消し去ってくれる商品をまとめました。。

気軽にお声かけください

このような形でほぼ毎日、情報発信を行ってます。技術的な部分で誤っている点などもあるかもしれません。その様な部分を発見した方はTwitterのDMなどで知らせていただければ凄い嬉しいです。また自身自身のエンジニアのネットワークを広げたいと思ってます。日頃六本木や渋谷にいることが多いですので気軽にお誘いください。情報交換しましょう。

タイトルとURLをコピーしました